This article has not been translated into English yet. Showing the original Chinese version.

AlphaGo之父:AI正走在错误道路上

AlphaGo的创造者大卫·西尔弗(David Silver)认为当前AI发展路径存在根本性缺陷。他创立了一家估值十亿美元的新公司,致力于打造“超级学习者”——一种能够通过自我对弈和强化学习,在无人类数据依赖下掌握复杂技能的AI系统。西尔弗批评主流AI依赖大规模数据标注和算力堆砌,认为这忽略了智能的本质。本文深度解析他的观点与行业争议。

2016年,AlphaGo击败围棋世界冠军李世石,成为人工智能史上的里程碑事件。如今,AlphaGo的缔造者之一大卫·西尔弗(David Silver)却公开表示:当前的AI发展路径可能走错了方向。

从AlphaGo到“超级学习者”

西尔弗是DeepMind的早期核心成员,也是强化学习领域的顶级专家。他主导开发的AlphaGo通过自我对弈,在无人类棋谱依赖下达到超人类水平。如今,他创立了一家名为“Synthesis AI”的新公司,估值已突破十亿美元,目标直指“超级学习者”(Superlearners)。

“我们想要构建的是能够像AlphaGo自学围棋那样,自主掌握任何技能的AI系统。”——大卫·西尔弗

西尔弗认为,当前主流AI——尤其是大语言模型(LLMs)——存在根本性缺陷:它们过度依赖海量人类标注数据和计算资源,本质上是“高级模式匹配器”,而非真正的智能体。

“数据饥渴”的陷阱

他指出,GPT-4等模型需要消耗相当于数万人类寿命的文本数据进行训练,这暴露了其学习效率的低下。相比之下,人类儿童仅需少量经验就能掌握语言和推理能力。西尔弗的团队正探索将强化学习与元学习结合,使AI能在未知环境中通过少量试错快速适应。

这一观点在AI社区引发激烈争论。支持者认为,西尔弗指出了当前AI的“数据瓶颈”——随着高质量数据逐渐耗尽,模型性能提升将遭遇天花板。批评者则反驳,大语言模型已在推理、代码生成等任务上展现惊人能力,其学习效率虽不如人类,但规模效应可弥补不足。

行业反响与未来路径

谷歌、OpenAI等巨头正投入数十亿美元构建更大规模的模型,而西尔弗的“反潮流”路线显得尤为另类。他强调:“智能的核心不是数据量,而是探索与反馈的循环。” Synthesis AI目前聚焦于机器人控制和科学模拟领域,试图证明其方法的通用性。

编者按:西尔弗的批判触及AI发展的核心矛盾——是继续堆砌算力和数据,还是回归智能的底层机制?AlphaGo的成功曾证明“无监督自我进化”的潜力,但将其扩展到通用领域仍面临巨大挑战。或许,真正的突破需要两种路径的融合。

本文编译自WIRED