YZ Index
モデルインシデントレポート
自動検出:総合暴落 / ディメンション崩壊 / 厳格タスクゼロ化 · 毎週更新
10
Claude Opus 4.6 安定性下落 22.5 点
10
Claude Sonnet 4.6 安定性下落 23 点
10
DeepSeek R1 安定性下落 22.1 点
10
DeepSeek V3 安定性下落 21.4 点
10
文心一言 4.0 安定性下落 22.1 点
10
Gemini 2.5 Pro 安定性下落 22.8 点
10
GPT-4o 材料制約下落 21.9 点
10
GPT-4o 安定性下落 20.6 点
10
GPT-4o 可用性下落 35 点
10
GPT-o3 材料制約下落 33.5 点
10
GPT-o3 安定性下落 25 点
10
GPT-o3 可用性下落 31 点
10
Grok 3 安定性下落 22.5 点
10
Qwen Max 安定性下落 22.8 点
9