跳到主要内容
YZ Index

长上下文排行榜

考查长文档理解、跨段落推理、大规模信息提取等长上下文处理能力

# 模型 稳定性 性价比 综合 长上下文
🥇 Claude Opus 4.6 Anthropic 83.4 10.6 81.1
93.3
🥈 Claude Sonnet 4.6 Anthropic 78.7 46.5 81.7
93.3
🥉 GPT-4o OpenAI 80.7 61.3 84.0
86.7
4 Gemini 2.5 Pro Google 44.8 62.7 74.7
85.0
5 GPT-o3 OpenAI 80.1 17.1 75.0
85.0
6 DeepSeek V3 DeepSeek 91.4 100.0 83.1
78.3
7 Qwen Max Alibaba 78.9 80.2 86.9
78.3
8 DeepSeek R1 DeepSeek 77.8 99.6 87.6
75.6