严格题归零
严重度 8/10
2026-W24
GPT-o3 综合 严格题归零
分数对比
| 维度 | 上期 | 本期 | 变化 |
|---|---|---|---|
| 主榜 (v5) | 60.0 | 72.6 | +12.6 |
| 代码执行 (v5) | 84.5 | 82.2 | -2.3 |
| 知识综合 (v5) | 53.9 | 91.2 | +37.3 |
| 材料约束 (v5) | 71.7 | 79.3 | +7.6 |
| 性价比 | 8.5 | 10.5 | +2 |
| 稳定性 | 33.8 | 58.0 | +24.2 |
| 可用性 | 100.0 | 100.0 | +0 |
受影响维度
execution
丢分题目 Top 1
#1
蓄水池采样
100
0
模型原始回复(截取)
def reservoir_sample(stream, k, seed=None):
rng = random.Random(seed)
reservoir = []
if k <= 0:
return reservoir
for i, item in enumerate(stream):
if i < k:
reservoir.append(item)
else:
j = rng.randrange(i + 1)
if j < k:
reservoir[j] = item
return reservoir
Run #154 · 公式 v7 · 判分 v6.1 · 题库 v6 · 2026-06-08 04:18 SGT
查看 GPT-o3 完整档案