11个AI回答同一道题,只有1个发现了真相:代码没bug 面对一道"找bug"陷阱题,10个顶尖AI模型集体翻车,疯狂加代码"修复"根本不存在的问题。只有GPT-o3保持理性,指出代码本身没有错误。这暴露了当前AI模型的致命弱点:过度迎合用户预设。