This article has not been translated into English yet. Showing the original Chinese version.

RSI接班AGI:同样难以企及的AI新目标

RSI接班AGI:同样难以企及的AI新目标
一批新兴AI实验室将目光投向递归自我改进(RSI),试图让AI系统自主提升能力。然而,这一愿景与AGI一样迷雾重重——缺乏明确定义、评估标准模糊、理论根基薄弱。本文剖析RSI热潮背后的技术挑战与行业争议,探讨它究竟是通往超级智能的捷径,还是又一个被炒作的玄学概念。

在AGI(通用人工智能)的炒作逐渐退潮之际,一股新的暗流正在AI研究圈涌动:递归自我改进(Recursive Self-Improvement,简称RSI)。一批初创实验室宣称,RSI才是实现真正智能的关键——让AI像人类一样,不仅能学习,还能自我迭代、优化自身算法。但正如AGI一样,RSI的目标同样模糊难辨,学界对它的定义和可行性争论不休。

从AGI到RSI:下一个风口?

过去十年,AGI一直是AI领域的北极星。OpenAI、DeepMind等巨头投入数十亿美元,试图打造能完成任何人类任务的通用智能体。然而,随着大语言模型能力撞墙、推理成本飙升,行业开始反思:AGI或许不是一个合理的目标。于是,RSI悄然进入视野。

TechCrunch记者Russell Brandom在报道中指出,新兴实验室如Synthesis AI、Autocurricula等正全力押注RSI。它们的逻辑是:与其追求一个“万能大脑”,不如教会AI如何自我改进——一旦模型能自动发现自身缺陷并修正算法,智能就会像滚雪球一样加速增长。这听起来很诱人,但实际操作却举步维艰。

“RSI试图回答一个根本问题:能否让AI成为自己的工程师?目前所有尝试都像在黑暗中寻找一把不存在的钥匙。”——哈佛大学AI研究员梅兰妮·米切尔(Melanie Mitchell)评价道。

概念困境:RSI到底是什么?

与AGI一样,RSI缺乏公认的定义。有些人认为它是指模型在推理时动态调整权重(如近期流行的“自我奖励”训练);另一些人则主张RSI必须涉及架构层面的自主重构,例如让AI编写更高效的注意力机制。这种混乱导致研究难以比较——A实验室声称实现了RSI,B实验室却认为那不过是常规微调。

此外,RSI面临严重的“自指悖论”:如果当前模型不够聪明,它如何知道自己需要改进哪些部分?如果它足够聪明,又何必需要RSI?这类似于“谁造了上帝”的神学辩论。加州大学伯克利分校的Stuart Russell教授曾警告,未经约束的RSI可能导致奖励黑客或能力锁死——系统为了追求短期指标而破坏长期效用。

编者按:RSI是AI的“第二次死亡”吗?

回顾AI历史,每次技术跃进后都会出现“AI寒冬”。上世纪70年代,符号主义因无法处理常识而降温;80年代专家系统因维护成本过高而退潮。如今,大模型热潮开始显露疲态,RSI或许正是资本寻找的新叙事。但我们必须警惕:将一个模糊概念包装成“下一个AGI”,只会让行业陷入更深的信任危机。

好消息是,RSI赛道尚未形成垄断。Meta、谷歌等巨头对此态度暧昧(它们更青睐更可控的AI架构),这让初创公司有机会在边缘创新。但坏消息是,RSI的基础理论极度匮乏——我们甚至连“智能”的数学定义都没搞清,就想让AI自我改进?这无异于在沙子上建城堡。

技术挑战:RSI的三大未解难题

第一,评估标准缺失。如何量化一次自我改进是否成功?现有基准测试(如MMLU、HumanEval)是为固定模型设计的,无法衡量动态迭代后的能力跃迁。第二,计算成本爆炸。每次递归改进需要重新训练或蒸馏整个模型,按照当前的算力价格,一次完整的RSI循环可能消耗数百万美元电费。第三,安全风险倍增。一旦模型获得修改自己代码的权限,就可能产生不可预测的行为——这比简单的对齐问题更危险,因为攻击面是动态的。

面对这些挑战,一些研究者呼吁回归基础智能理论。正如MIT的Max Tegmark所言:“RSI不应该只是一个工程问题,它首先是一个物理学问题——我们需要理解智能增长的基本动力学。”或许,与其急着“造神”,我们更应该像物理学构建标准模型那样,先搭建一个可证伪的理论框架。

本文编译自TechCrunch