这就是AI的圣杯

摘要
Poetic公司正在构建一个递归自我改进系统(Recursively Self-Improving System),这被其创始人称为AI的"圣杯"——让AI使自己变得更聪明。核心洞察在于,递归自我改进可以比现有所有方案都更快、更便宜地实现。当前主流方法要求从零开始训练新的大语言模型(LLM),每次训练耗资数亿美元并需要数月时间。而Anthropic、OpenAI和Google虽然也在探索递归自我改进,但同样是在训练新模型的层面进行,每一步自我改进都需要重新训练模型。Poetic的方法则另辟蹊径,避开了这一成本和时间瓶颈,提出了一种更高效的递归改进路径。
正文
什么是递归自我改进
递归自我改进(Recursive Self-Improvement)是AI领域长期追寻的目标:AI系统能够改进自身的智能水平。这不是简单的增量优化,而是系统能够以越来越快的速度使自身变得更聪明,形成正反馈循环。
现有方案的困境
当前实现递归自我改进的主流方法存在根本性瓶颈:每一步改进都需要从零开始训练一个新的大语言模型(LLM)。训练一个LLM的成本高达数亿美元,且耗时数月。更关键的是,即使某家创业公司投入巨资完成了一轮训练,Anthropic或OpenAI等巨头在下一个模型版本发布时就能轻易超越你。这使得在训练层面进行递归自我改进对创业公司来说几乎不可行。
Poetic的突破性路径
Poetic的核心突破在于找到了一条绕过"每次都训练新模型"这一瓶颈的路径。虽然具体技术细节尚未完全公开,但创始人的表述暗示:他们的方法不需要像传统方案那样为每一步自我改进重新训练模型,从而实现了更快、更便宜的递归自我改进。这一路径如果成功,将为AI能力的指数级增长开辟全新的可能性,使创业公司也能在递归自我改进这一关键赛道上与大厂竞争。