Claude优势 (共1篇)

GPT-5.5暴跌19.2分！6模型WDCD守约测试集体退步

本轮WDCD测试中6个模型全部下滑，无一上升，GPT-5.5跌19.2分最惨，Gemini与Qwen跌幅均超6分。Claude Opus 4.7仍以65分领跑，显示其在约束遵循上具备明显优势，值得持续追踪。