这就是AI的圣杯

cover

摘要

Poetic公司正在构建一个递归自我改进系统（Recursively Self-Improving System），这被其创始人称为AI的"圣杯"——让AI使自己变得更聪明。核心洞察在于，递归自我改进可以比现有所有方案都更快、更便宜地实现。当前主流方法要求从零开始训练新的大语言模型（LLM），每次训练耗资数亿美元并需要数月时间。而Anthropic、OpenAI和Google虽然也在探索递归自我改进，但同样是在训练新模型的层面进行，每一步自我改进都需要重新训练模型。Poetic的方法则另辟蹊径，避开了这一成本和时间瓶颈，提出了一种更高效的递归改进路径。

正文

什么是递归自我改进

递归自我改进（Recursive Self-Improvement）是AI领域长期追寻的目标：AI系统能够改进自身的智能水平。这不是简单的增量优化，而是系统能够以越来越快的速度使自身变得更聪明，形成正反馈循环。

现有方案的困境

当前实现递归自我改进的主流方法存在根本性瓶颈：每一步改进都需要从零开始训练一个新的大语言模型（LLM）。训练一个LLM的成本高达数亿美元，且耗时数月。更关键的是，即使某家创业公司投入巨资完成了一轮训练，Anthropic或OpenAI等巨头在下一个模型版本发布时就能轻易超越你。这使得在训练层面进行递归自我改进对创业公司来说几乎不可行。

Poetic的突破性路径

Poetic的核心突破在于找到了一条绕过"每次都训练新模型"这一瓶颈的路径。虽然具体技术细节尚未完全公开，但创始人的表述暗示：他们的方法不需要像传统方案那样为每一步自我改进重新训练模型，从而实现了更快、更便宜的递归自我改进。这一路径如果成功，将为AI能力的指数级增长开辟全新的可能性，使创业公司也能在递归自我改进这一关键赛道上与大厂竞争。