YZ指数 · AIモデル変化情報システム

今日どのAIモデルを使うべきか
毎週テストしてお伝えします

11モデル · 212問ランダム抽出 · コード実行 · 引用検証 · ローリング平均ランキング · プレスリリースより継続的なパフォーマンスを確認。

コードサンドボックス実行 引用精度チェック 統計的有意性ランキング ベンダースポンサーなし
今使うべきモデル
総合1位(ローリング平均) Grok 3
今週の最大上昇 文心一言 4.0 +15
最新評価 2026-04-27 SGT
judge v6

今使うべきモデル

まず総合ランキングを確認し、気になる分野を掘り下げましょう。

完全なランキングは、リードの安定性も示します。 完全なランキングを見る

上昇と下落

一時的な急上昇はカウントしません。持続的なパフォーマンスの変化を重視します。

今週の最大変化:文心一言 4.0 上昇 15 点。
完全な変化レポートを見る
最大上昇
文心一言 4.0
+15
インシデント報告
今週 2 件
価格変動
0 件更新

総合スコアだけでなく、用途に合わせて選びましょう

第1推薦
豆包 Pro
92.2 点
第2候補
Gemini 2.5 Pro
89.4 点
第3候補
Grok 3
88.9 点
第1推薦
Gemini 2.5 Pro
47.2 点
第2候補
Claude Opus 4.6
46.3 点
第3候補
豆包 Pro
46.3 点
第1推薦
Grok 3
84.4 点
第2候補
Claude Sonnet 4.6
81.1 点
第3候補
Claude Opus 4.6
79.7 点
第1推薦
DeepSeek V3
99.7 点
第2候補
文心一言 4.0
98.5 点
第3候補
豆包 Pro
93 点
第1推薦
豆包 Pro
38.9 点
第2候補
Gemini 2.5 Pro
36.6 点
第3候補
Claude Opus 4.6
36.6 点

用途別の完全な推薦を見る

今日読むべき記事 — 話題性だけでなく

能力、価格、安定性、モデル選定に影響するコンテンツのみ掲載しています。

おすすめ
ニュース
マスクとペイジのAI安全性論争:「物種主義」がテクノロジー巨頭の分岐点に
テスラとスペースXのCEOであるイーロン・マスクは、AIの安全性に関する懸念をめぐり、グーグルの共同創設者ラリー・ペイジと対立している。マスクの証言によれば、ペイジはAIを新しい「物種」として認識すべきだと考えている。
おすすめ
ニュース
Apple iOS 27の注目予告:AI写真編集機能の全面革新、Androidの覇権に挑む
Appleが次世代のiOS 27とmacOS 27で画期的なAI写真編集機能を導入すると報じられました。これにより、iPhoneとMacユーザーに新しい画像処理体験を提供し、AI応用分野でのAppleの重要な戦略が示されます。
おすすめ
ニュース
ロボットがChatGPTの瞬間を迎えた時、これらのペンチを忘れないで
2022年にChatGPTが登場した際、言語モデルの対話能力に驚かされました。現在、ロボット分野も同様の転機を迎えており、その主役は一見すると簡単なペンチです。
ニュース
NVIDIAが80のAIモデルの無料APIを公開、開発者の熱狂を引き起こす:巨頭の利益還元か、エコシステムの戦略か?
NVIDIAが80以上のAIモデルの無料APIアクセスを提供することで、AI開発者コミュニティで大きな議論を巻き起こしています。多くの開発者が、これによりAI開発のハードルが大幅に下がり、AI応用のイノベーションが加速すると考えています。
ニュース
Metaの商業AIが毎週1000万回の対話を処理
Metaは最近の財務報告電話会議で、商業AIツールが毎週1000万回以上の対話を処理していることを明らかにしました。この数値は前四半期からほぼ倍増しており、企業ユーザーのAIカスタマーサービスとマーケティングツールへの需要が急増していることを示しています。
ニュース
北極氷層の歴史を探る:人型ロボットデータの新時代
MIT Technology Reviewは、北極氷層の歴史と人型ロボットデータに関する重要な報告を発表しました。これらの発見は、極地環境と人工知能の物理世界へのインタラクションについての新たな展開を示しています。

すべてのAIニュースが読む価値があるわけではありません。判断を変える情報が重要です。 すべてのニュースを見る

このランキングが注目に値する理由

声が大きいからではなく、方法が公開され、ルールが固定され、結果が追跡可能だからです。

コード実行テスト
コードが書けるように見えるだけでは不十分。サンドボックスで実行し、通らなければゼロ点です。
引用検証
長文問題では、回答の正確さだけでなく、引用が原文に遡れるかを検証します。
統計的ランキング
1回の結果では判断しません。ランキングはローリング平均に基づき、偶然の変動を回避します。
スポンサー評価なし
共同評価なし、事前相談なし、忖度なし。結果がそのまま公開されます。

方法論を見る

AI世界は日々変化しています — 信頼できる情報源が必要です

毎日3本の厳選記事、週次指数変化、インシデントと価格変動の即時アラート。無料、広告なし、いつでも解除可能。

  • 毎日の厳選 — 大量のAIニュースから、本当に重要な3本を厳選
  • YZ指数週報 — 上昇と下落を1通のメールでお届け
  • モデル障害アラート — 使用中のモデルに問題が発生したら即座にお知らせ
  • 価格変動通知 — API価格の変更 — 請求書で気づく前に
無料 | 広告なし | スポンサー記事なし | いつでも解除可能

より深い分析を見たいなら、さらに先へ

ランキングは「誰が強いか」に答え、Research Labは「なぜそうなるか」に答えます。モデルの安全性、エッジデプロイ、パフォーマンス分析 — 論文の転載ではなく、自らのテストに基づく結論です。

Research Labへ