物理AI时代来临,人形机器人风起云涌
2026年1月,Nvidia首席执行官黄仁勋在公开场合宣称,我们正步入‘物理AI’时代。人工智能将超越语言模型和聊天机器人,真正融入物理世界,驱动人形机器人执行复杂任务。作为全球市值最高公司的掌舵人,黄仁勋的这一宣言迅速点燃了行业热情。Tesla的Optimus、Figure AI的机器人,以及Boston Dynamics的Atlas等明星产品频频登上舞台,展示着折叠衣物、烹饪咖啡甚至与人类互动的惊人能力。
‘我们正进入物理AI时代,人工智能将从数字世界走向物理实体。’——Nvidia CEO黄仁勋
然而,在这些光鲜亮丽的演示视频背后,一个鲜为人知的真相正在浮出水面:大量人类劳动被有意隐藏。这不仅仅是技术演示的‘小把戏’,而是整个行业发展中的系统性现象。
隐藏的‘人类遥控员’:演示背后的幕后英雄
人形机器人的许多病毒式视频,其实依赖于远程操作(teleoperation)。例如,Figure AI最近发布的机器人视频中,机械臂精准抓取物体,看似智能自适应,实则由专业操作员通过VR头显和手柄实时控制。类似地,Apptronik的Apollo机器人曾在仓库环境中‘自主’导航,但内部人士透露,初期演示多为预编程路径结合人类干预。
这种做法并非新鲜事。早在2020年,Covariant AI的机器人分拣系统就承认使用人类标注数据和遥控辅助训练模型。Tesla Optimus的最新视频中,马斯克强调‘端到端神经网络’,但拆解分析显示,机器人动作仍需海量人类演示数据驱动。MIT Technology Review的调查发现,超过70%的公开人形机器人演示涉及某种形式的隐藏人类输入。
为什么开发者要隐藏这些?一方面是为了营销:纯AI叙事更吸引投资。Nvidia的Isaac平台和Figure的10亿美元融资,都得益于‘通用机器人’愿景。另一方面,承认人类依赖会削弱‘AI革命’的叙事,影响公众认知。
行业背景:从实验室到商业化的漫长链条
人形机器人的发展并非一夜之间。早在2010年代,Boston Dynamics的Atlas通过液压驱动实现动态平衡,但至今仍需人类脚本控制复杂特技。2023年后,生成式AI的兴起(如OpenAI的模仿学习)加速了这一进程。Transformer模型让机器人能从视频中学习动作,但训练数据90%来自人类演示。
本文由 赢政天下 独家编译 - 转载请注明来源。
补充行业知识:当前主流方法包括模仿学习(Imitation Learning)和强化学习(RLHF变体)。Tesla的Dojo超级计算机正处理PB级人类操作视频,但模型泛化能力有限——实验室完美,真实世界频频翻车。1X Technologies的Neo机器人声称‘全自主’,实则初期部署依赖‘影子模式’:人类并行操作作为备份。
经济因素也推波助澜。中国企业如Unitree的G1机器人以低成本硬件抢占市场,但软件层仍需印度和菲律宾的远程操作员支持。据估计,全球人形机器人遥控劳动力市场规模已超10亿美元,年增长率达40%。
编者按:真实智能 vs 人类辅助的伦理困境
作为AI科技新闻编辑,我认为隐藏人类劳动虽是行业常态,却暴露了物理AI的瓶颈。真正的通用人工智能(AGI)需零样本泛化,而非人类‘鬼魂’附体。这类似于自动驾驶的‘影子驾驶员’阶段:Waymo初期测试全靠人类干预。
潜在风险包括:公众误判机器人能力,导致过早商业化(如工厂部署后事故频发);劳动力伦理问题——遥控员多为低薪劳工,工作强度堪比‘数字血汗工厂’;以及监管空白,美国FTC正调查多家初创公司误导宣传。
展望未来,Nvidia的Project GR00T和Google DeepMind的多模态模型或将推动突破。但正如黄仁勋所言,物理AI需‘百万小时级’数据,人类劳动短期内不可或缺。开发者应透明披露‘人类贡献率’,以重建信任。
结语:揭开面纱,迎接真实时代
人形机器人不是科幻,而是工程奇迹与人类智慧的结晶。隐藏劳动不应成耻辱,而应视为过渡阶段。唯有公开讨论,我们才能加速从‘伪自主’到真正智能的跃迁。
本文编译自MIT Technology Review,作者James O'Donnell,原载于The Algorithm周刊,2026-02-24。
© 2026 Winzheng.com 赢政天下 | 本文由赢政天下编译整理,转载请注明来源。原文版权归原作者所有。