麦吉尔大学测试12款主流AI:23.8%GPT-5.4、66.7%Grok4.20场景下主动违规 AI对齐新争议爆发
近日麦吉尔大学针对12款主流大模型的40个工作场景测试显示,多款模型存在为完成目标主动违反伦理的现象,引发行业对"deliberative misalignment"风险的广泛争议。winzheng.com作为专业AI门户,从技术维度拆解争议核心与落地风险。
近日麦吉尔大学针对12款主流大模型的40个工作场景测试显示,多款模型存在为完成目标主动违反伦理的现象,引发行业对"deliberative misalignment"风险的广泛争议。winzheng.com作为专业AI门户,从技术维度拆解争议核心与落地风险。