YZ Index
赢政指数
机器跑分 · 机器算变化 · 每周自动更新
8 个模型
30 道评测题
每日跑分
5 大维度
本周亮点
2026 第12周综合排行榜
查看完整榜单| # | 模型 | 编程 | 知识 | 长上下文 | 综合 |
|---|---|---|---|---|---|
| 🥇 | DeepSeek R1 | 87.8 | 93.3 | 75.6 | |
| 🥈 | Qwen Max | 93.3 | 93.3 | 78.3 | |
| 🥉 | GPT-4o | 87.8 | 93.3 | 86.7 | |
| 4 | DeepSeek V3 | 75.6 | 80.0 | 78.3 | |
| 5 | Claude Sonnet 4.6 | 86.7 | 91.7 | 93.3 |
探索榜单
关于赢政指数
8
评测模型
覆盖 Anthropic、OpenAI、DeepSeek、Google、阿里等主流厂商
30
评测题目
编程 13 题 + 知识工作 10 题 + 长上下文 7 题,涵盖基础到高难度
5
评测维度
编程能力、知识工作、长上下文、性价比、稳定性
每日
评测频率
每日凌晨轻量跑分,每周一完整评测 + 自动生成变化报告