GPT-o3知识工作暴跌12分:逻辑推理能力疑似退化
本周GPT-o3在知识工作维度出现罕见的断崖式下跌,从82.4分骤降至70.3分,降幅达14.7%。这一异常变化主要集中在逻辑推理和翻译任务上,值得深入分析。核心问题:逻辑推理能力显著退化最严重的失分项是"排班冲突"题目,得分从满分100直接跌至10分。该题要求根据5个员工的时间限制安排一周...
本周GPT-o3在知识工作维度出现罕见的断崖式下跌,从82.4分骤降至70.3分,降幅达14.7%。这一异常变化主要集中在逻辑推理和翻译任务上,值得深入分析。核心问题:逻辑推理能力显著退化最严重的失分项是"排班冲突"题目,得分从满分100直接跌至10分。该题要求根据5个员工的时间限制安排一周...