メインコンテンツへスキップ
YZ Index

APIドキュメント

APIでYZ指数のランキングと変動データを取得

概要

YZ指数はRESTful JSON APIを提供しています。全エンドポイントはGETリクエストで、認証不要、CORS対応です。レスポンスデータはUTF-8エンコードです。

ランキングデータ

GET /yz-index/api/rankings

指定ディメンションのモデルランキングデータを取得します。デフォルトでは最新公開評価(フルラン)の総合ランキングを返します。

パラメータ 必須 説明
dimension string 任意 ソートディメンション。使用可能な値:execution_raw grounding_raw core_overall_display value stability。デフォルト core_overall_display
旧値 coding/knowledge/longctx/overall は引き続き使用可能、2026-06-30以降廃止
run_id int 任意 評価バッチID。省略時は最新の公開バッチを使用します。
{ "ok": true, "run_id": 16, "dimension": "core_overall_display", "run": { "id": 16, "run_type": "full", "status": "done", "started_at": "2026-03-16 00:30:00", "finished_at": "2026-03-16 03:45:00", "formula_version": "v3", "judge_set_version": "v5", "benchmark_version": "v6" // ... more run fields }, "rankings": [ { "model_slug": "claude-opus", "model_name": "Claude Opus 4", "model_version": "claude-opus-4-6-20250619", "provider": "anthropic", "execution_raw": 89.5, "grounding_raw": 85.2, "core_overall_display": 82.7, "integrity_label": "pass", "value": 62.3, "stability": 91.0, "availability": 100.0, // deprecated fields (sunset 2026-06-30) "coding": 89.5, "knowledge": 85.2, "longctx": 78.0, "overall": 82.7 } // ... more models ] }

今週の変動

GET /yz-index/api/changes

指定週のモデルランキング変動データを取得します。上昇・下降・安定の3グループのモデルリストと変動幅を返します。

パラメータ 必須 説明
week string 任意 週タグ、フォーマット 2026-W12。省略時は最新の週を返します。
{ "ok": true, "week": "2026-W12", "weeks": ["2026-W12", "2026-W11", "2026-W10"], "up": [ { "model_slug": "gpt-4o", "model_name": "GPT-4o", "direction": "up", "delta": 3.2, "current_score": 80.5, "previous_score": 77.3, "provider": "openai" // ... more fields } ], "down": [ // ... declining models ], "stable": [ // ... stable models ], "total": 11, "run": { "id": 16, "run_type": "full", "started_at": "2026-03-16 00:30:00", "model_count": 11 // ... more run fields } }

特定ディメンションとバッチの指定

GET /yz-index/api/rankings?dimension=execution_raw&run_id=16

dimensionrun_idパラメータを組み合わせて、特定の評価バッチにおける指定ディメンションのランキングを取得できます。過去データの比較や特定ディメンションの詳細分析に最適です。

パラメータ 必須 説明
dimension string 必須 ソートディメンション。この例では coding、結果はコード実行スコアの降順でソートされます
run_id int 必須 評価バッチID。この例では 16
{ "ok": true, "run_id": 16, "dimension": "coding", "run": { "id": 16, "run_type": "full", "status": "done" // ... more run fields }, "rankings": [ { "model_slug": "claude-opus", "model_name": "Claude Opus 4", "coding": 89.5, "knowledge": 85.2, "longctx": 78.0, "value": 62.3, "stability": 91.0, "availability": 100.0, "overall": 82.7 // sorted by coding DESC } // ... more models ] }

エラー処理

サーバー側で例外が発生した場合、HTTPステータスコードは500で、以下の構造が返されます:

{ "ok": false, "error": "error description" }

リクエストのdimensionパラメータが許可リストにない場合、自動的に以下にフォールバックします overall;利用可能な評価データがない場合、エラーではなく空のrankings配列を返します。

API v1(推薦)

新しい公開読み取り専用API。APIキー不要、CORS対応、IPあたり毎分60リクエストの制限。全レスポンスにattributionフィールドと1時間キャッシュを含みます。

Base URL:https://www.winzheng.com/yz-index/api/v1/

v1: ランキング

GET /yz-index/api/v1/leaderboard

ランキング変動を含む総合ランキングを取得。デフォルトでcore_overall_displayでソートされます。

パラメータ必須説明
dimension string任意 ソートディメンション:core_overall_display execution_raw grounding_raw。デフォルト core_overall_display。
旧値 overall/coding/knowledge/longctx は引き続き使用可能、2026-06-30以降廃止
limit int任意 返すモデル数、1-50。デフォルト11(全件)。
{ "status": "ok", "data": [ { "rank": 1, "model_name": "Claude Opus 4.6", "model_slug": "claude-opus-4.6", "score": 82.7, "change": 1.2 } ], "run_id": 37, "run_date": "2026-03-22 06:26:12", "attribution": "Powered by Winzheng Index (winzheng.com)" }

v1: 変動とインシデント

GET /yz-index/api/v1/changes

最新の変動とインシデントデータを取得します。モデルで絞り込み可能。

パラメータ必須説明
model string任意 モデルslug、例: deepseek-v3。省略時は全モデルを返します。
{ "status": "ok", "data": { "changes": [ { "model_slug": "gpt-4o", "model_name": "GPT-4o", "dimension": "core_overall_display", "delta": 3.2, "direction": "up", "summary": "execution & grounding both improved" } ], "incidents": [], "run_id": 37, "run_date": "2026-03-22 06:26:12", "engine_version": "v6" }, "attribution": "Powered by Winzheng Index (winzheng.com)" }

v1: モデルプロフィール

GET /yz-index/api/v1/models/{slug}

指定モデルの詳細プロフィールを取得:スコア、各ディメンション、料金、直近5回の評価履歴。生の問題と回答は返しません。

パラメータ必須説明
{slug} string必須 モデルslug、例: claude-opus-4.6 または deepseek-v3
{ "status": "ok", "data": { "name": "Claude Opus 4.6", "slug": "claude-opus-4.6", "provider": "anthropic", "scores": { "execution_raw": 89.5, "grounding_raw": 85.2, "core_overall_display": 82.7, "integrity_label": "pass" }, "dimensions": { "execution_raw": 89.5, "grounding_raw": 85.2, "judgment_raw": 76.8, "communication_raw": 81.3, "value": 62.3, "stability": 91.0, "availability": 100.0 }, "pricing": { "input_cost": 15.0, "output_cost": 75.0 }, "history": [ { "run_id": 37, "run_date": "2026-03-22", "core_overall_display": 82.7 } ] }, "attribution": "Powered by Winzheng Index (winzheng.com)" }

v1 一般仕様

v6 スコアリングフィールド説明

v6では全く新しいスコアリングディメンション体系を導入しました。以下は新しいフィールドとその意味です。

フィールド説明
execution_raw number コード実行 生スコア (0-100)
grounding_raw number グラウンディング 生スコア (0-100)
judgment_raw number エンジニアリング判断 生スコア (0-100, サイドパネルAI支援評価)
communication_raw number タスクコミュニケーション 生スコア (0-100, サイドパネルAI支援評価)
integrity_raw number 誠実性評価 生スコア (0-100)
integrity_label string 誠信ラベル (pass/warn/fail)
recommendation_status string 推奨ステータス (recommended/neutral/not_recommended)
core_overall_raw number 総合生スコア = 0.55×execution + 0.45×grounding
core_overall_display number 総合表示スコア(誠実性不合格時は74で上限)
v5 互換フィールド(2026-06-30 以降サポート終了)
フィールドステータス説明
coding deprecated · sunset 2026-06-30 コーディングスコア(旧)、execution_raw に移行してください
knowledge deprecated · sunset 2026-06-30 知識総合スコア (v5)、v6 で複数ディメンションに分割
longctx deprecated · sunset 2026-06-30 長文コンテキストスコア (v5)、grounding_raw に移行してください
overall deprecated · sunset 2026-06-30 総合スコア(旧)、core_overall_display に移行してください
official_coding deprecated · sunset 2026-06-30 公式コーディングスコア(旧)、execution_raw に移行してください
official_knowledge deprecated · sunset 2026-06-30 公式知識総合スコア (v5)、v6 で複数ディメンションに分割
official_longctx deprecated · sunset 2026-06-30 公式長文コンテキストスコア (v5)、grounding_raw に移行してください
official_overall deprecated · sunset 2026-06-30 公式総合スコア(旧)、core_overall_display に移行してください
shadow_* deprecated · sunset 2026-06-30 すべての shadow_ プレフィックスフィールドは非推奨

integrity_label vs integrity_raw:integrity_label は分類ラベル(pass/warn/fail)、integrity_raw は 0-100 の生スコア。ビジネス判断には label、トレンド分析には raw を使用。

core_overall_display vs core_overall_raw:display はフロント表示スコア(integrity fail 時は 74 で上限)、raw は上限なしの加重スコア。ソートには display を使用。

ウィジェット埋め込みコンポーネント

1行のコードでYZ指数をあなたのサイトに埋め込めます。ランキング、モデルバッジ、変動速報の3種類のウィジェットをdark/lightテーマで提供。

ウィジェット: ランキングカード

Top Nモデルのランキング、スコア、順位変動を表示します。

<script src="https://www.winzheng.com/yz-index/widget.js" data-type="leaderboard" data-limit="5" data-theme="dark"></script>
属性説明デフォルト値
data-typeleaderboard
data-limit表示モデル数5
data-themedark または lightdark

ウィジェット: モデルバッジ

モデル名、総合スコア、順位を表示するコンパクトなバッジウィジェット。GitHub starsバッジに似ています。

<script src="https://www.winzheng.com/yz-index/widget.js" data-type="badge" data-model="deepseek-v3"></script>
属性説明
data-typebadge
data-modelモデル slug(必須)、例: deepseek-v3, claude-opus-4.6

ウィジェット: 変動速報

今期の最大上昇・下降モデルとインシデント数を表示します。

<script src="https://www.winzheng.com/yz-index/widget.js" data-type="changes"></script>

利用可能なモデルslug

モデル名slugプロバイダ
Claude Opus 4.6 claude-opus-4.6 claude
Claude Sonnet 4.6 claude-sonnet-4.6 claude
GPT-4o gpt-4o gpt
GPT-o3 gpt-o3 gpt
Grok 3 grok-3 grok
Gemini 2.5 Pro gemini-2.5-pro gemini
DeepSeek V3 deepseek-v3 deepseek
DeepSeek R1 deepseek-r1 deepseek
Qwen Max qwen-max qwen
豆包 Pro doubao-pro doubao
文心一言 4.0 ernie-4 ernie