YZ Index
赢政指数 · 可用性排行榜
API调不通、超时、报错、拒绝服务——全算失败。再聪明用不了等于零。
排名基于最近 5 次评测滚动均值,非单次成绩
| # | 模型 | 可用性 | 稳定性 | 代码执行 | 主榜分 |
|---|---|---|---|---|---|
| 🥇 | Claude Opus 4.6 claude | 36.6 | 88.3 | 69 | |
| 🥈 | DeepSeek R1 DeepSeek | 32.2 | 87.6 | 80.9 | |
| 🥉 | DeepSeek V3 DeepSeek | 32.9 | 88.7 | 82.9 | |
| 4 | Gemini 2.5 Pro gemini | 36.6 | 91 | 77.2 | |
| 5 | Qwen Max qwen | 31.6 | 79.5 | 73.8 | |
| 6 | Claude Sonnet 4.6 claude | 本期 99 | 36.1 | 88.3 | 72.4 |
| 7 | 豆包 Pro doubao | 本期 100 | 38.9 | 93.1 | 85.8 |
| 8 | 文心一言 4.0 ernie | 本期 100 | 29.9 | 79.6 | 79.5 |
| 9 | Grok 3 grok | 本期 99 | 34.4 | 84.8 | 73.4 |
| 10 | GPT-o3 gpt | 本期 87 | 31.7 | 77.6 | 62 |
| 11 | GPT-4o gpt | 本期 91 | 29.6 | 75.7 | 63.3 |