跳到主要内容

Grok 3

变化分析 · 2026 第15周

Grok 3 2026 第15周代码执行 (v5) 维度下跌 14.4 分

分数对比

65.6 60.5 -5.1
维度 上次 本次 变化
代码执行 (v5) 91.2 76.8 -14.4
知识综合 (v5) 51.6 49.6 -2
材料约束 (v5) 83.8 83.1 -0.7
性价比 25.1 22.9 -2.2
稳定性 35.9 30.4 -5.5
可用性 100 100 0

所有匹配题目的分数无变化,或无法匹配上次评测的题目。

返回升降榜