MIT
谷歌DeepMind质疑:聊天机器人是否只是道德作秀?
谷歌DeepMind呼吁对大语言模型(LLM)的道德行为进行与编程或数学能力同等的严谨审查。随着LLM性能提升,人们越来越依赖它们扮演伴侣、治疗师、医疗顾问等角色。DeepMind强调,需要开发标准化基准来评估AI在道德困境中的真实表现,而非表面说教。文章探讨了AI伦理评估的紧迫性,以及当前基准测试的不足,呼吁行业共同推动更可靠的道德AI发展。(128字)