跳到主要内容
维度下跌 严重度 10/10 2026-W12

DeepSeek V3 稳定性下跌 21.4 分

DeepSeek V3 Run #37

分数对比

维度 上期 本期 变化
主榜 (v5) 52.9 66.6 +13.7
代码执行 (v5) 20.2 62.8 +42.6
知识综合 (v5) 36.4 44.3 +7.9
材料约束 (v5) 62.3 78.2 +15.9
性价比 94.0 99.1 +5.1
稳定性 53.4 32.0 -21.4
可用性 100.0 100.0 +0

受影响维度

稳定性
Run #37 · 公式 v5 · 判分 v6 · 题库 v5.1 · 2026-03-22 14:26 SGT
查看 DeepSeek V3 完整档案