YZ Index

赢政指数

机器跑分 · 机器算变化 · 每周自动更新

8 个模型 30 道评测题 每日跑分 5 大维度

本周亮点

2026 第12周

综合排行榜

查看完整榜单
# 模型 编程 知识 长上下文 综合
🥇 DeepSeek R1 87.8 93.3 75.6
87.6
🥈 Qwen Max 93.3 93.3 78.3
86.9
🥉 GPT-4o 87.8 93.3 86.7
84.0
4 DeepSeek V3 75.6 80.0 78.3
83.1
5 Claude Sonnet 4.6 86.7 91.7 93.3
81.7

探索榜单

编程能力榜

算法实现、Debug找错、SQL编写、动态规划、并发分析

知识工作榜

摘要生成、邮件撰写、翻译、逻辑推理、数据分析

综合排行榜

五大维度加权综合,一张表看清全局实力

本周升降榜

谁涨了?谁跌了?一眼看清本周 AI 世界的变化

关于赢政指数

8
评测模型
覆盖 Anthropic、OpenAI、DeepSeek、Google、阿里等主流厂商
30
评测题目
编程 13 题 + 知识工作 10 题 + 长上下文 7 题,涵盖基础到高难度
5
评测维度
编程能力、知识工作、长上下文、性价比、稳定性
每日
评测频率
每日凌晨轻量跑分,每周一完整评测 + 自动生成变化报告