APIドキュメント
APIでYZ指数のランキングと変動データを取得
概要
YZ指数はRESTful JSON APIを提供しています。全エンドポイントはGETリクエストで、認証不要、CORS対応です。レスポンスデータはUTF-8エンコードです。
- ベースURL:https://www.winzheng.com/yz-index/api/
- レスポンス形式:application/json; charset=utf-8
- 全エンドポイントは成功時に"ok": trueを返します。失敗時は"ok": falseと"error"フィールドを返します。
ランキングデータ
指定ディメンションのモデルランキングデータを取得します。デフォルトでは最新公開評価(フルラン)の総合ランキングを返します。
リクエストパラメータ
| パラメータ | 型 | 必須 | 説明 |
|---|---|---|---|
| dimension | string | 任意 | ソートディメンション。使用可能な値:execution_raw grounding_raw core_overall_display value stability。デフォルト core_overall_display。 旧値 coding/knowledge/longctx/overall は引き続き使用可能、2026-06-30以降廃止 |
| run_id | int | 任意 | 評価バッチID。省略時は最新の公開バッチを使用します。 |
レスポンス例
今週の変動
指定週のモデルランキング変動データを取得します。上昇・下降・安定の3グループのモデルリストと変動幅を返します。
リクエストパラメータ
| パラメータ | 型 | 必須 | 説明 |
|---|---|---|---|
| week | string | 任意 | 週タグ、フォーマット 2026-W12。省略時は最新の週を返します。 |
レスポンス例
特定ディメンションとバッチの指定
dimensionとrun_idパラメータを組み合わせて、特定の評価バッチにおける指定ディメンションのランキングを取得できます。過去データの比較や特定ディメンションの詳細分析に最適です。
リクエストパラメータ
| パラメータ | 型 | 必須 | 説明 |
|---|---|---|---|
| dimension | string | 必須 | ソートディメンション。この例では coding、結果はコード実行スコアの降順でソートされます |
| run_id | int | 必須 | 評価バッチID。この例では 16 |
レスポンス例
エラー処理
サーバー側で例外が発生した場合、HTTPステータスコードは500で、以下の構造が返されます:
リクエストのdimensionパラメータが許可リストにない場合、自動的に以下にフォールバックします overall;利用可能な評価データがない場合、エラーではなく空のrankings配列を返します。
API v1(推薦)
新しい公開読み取り専用API。APIキー不要、CORS対応、IPあたり毎分60リクエストの制限。全レスポンスにattributionフィールドと1時間キャッシュを含みます。
Base URL:https://www.winzheng.com/yz-index/api/v1/
v1: ランキング
ランキング変動を含む総合ランキングを取得。デフォルトでcore_overall_displayでソートされます。
リクエストパラメータ
| パラメータ | 型 | 必須 | 説明 |
|---|---|---|---|
| dimension | string | 任意 | ソートディメンション:core_overall_display execution_raw grounding_raw。デフォルト core_overall_display。 旧値 overall/coding/knowledge/longctx は引き続き使用可能、2026-06-30以降廃止 |
| limit | int | 任意 | 返すモデル数、1-50。デフォルト11(全件)。 |
レスポンス例
v1: 変動とインシデント
最新の変動とインシデントデータを取得します。モデルで絞り込み可能。
リクエストパラメータ
| パラメータ | 型 | 必須 | 説明 |
|---|---|---|---|
| model | string | 任意 | モデルslug、例: deepseek-v3。省略時は全モデルを返します。 |
レスポンス例
v1: モデルプロフィール
指定モデルの詳細プロフィールを取得:スコア、各ディメンション、料金、直近5回の評価履歴。生の問題と回答は返しません。
パスパラメータ
| パラメータ | 型 | 必須 | 説明 |
|---|---|---|---|
| {slug} | string | 必須 | モデルslug、例: claude-opus-4.6 または deepseek-v3 |
レスポンス例
v1 一般仕様
- Rate Limit:IPあたり毎分60リクエスト。超過時は以下を返します 429 Too Many Requests
- CORS:Access-Control-Allow-Origin: *
- Cache:Cache-Control: public, max-age=3600(1時間)
- APIキー不要、直接GETリクエスト
- 全レスポンスにattributionフィールドが含まれます。データ引用時はソースを保持してください。
- エラーレスポンス形式:{"status":"error","error":"..."}
v6 スコアリングフィールド説明
v6では全く新しいスコアリングディメンション体系を導入しました。以下は新しいフィールドとその意味です。
新規フィールド(v6)
| フィールド | 型 | 説明 |
|---|---|---|
| execution_raw | number | コード実行 生スコア (0-100) |
| grounding_raw | number | グラウンディング 生スコア (0-100) |
| judgment_raw | number | エンジニアリング判断 生スコア (0-100, サイドパネルAI支援評価) |
| communication_raw | number | タスクコミュニケーション 生スコア (0-100, サイドパネルAI支援評価) |
| integrity_raw | number | 誠実性評価 生スコア (0-100) |
| integrity_label | string | 誠信ラベル (pass/warn/fail) |
| recommendation_status | string | 推奨ステータス (recommended/neutral/not_recommended) |
| core_overall_raw | number | 総合生スコア = 0.55×execution + 0.45×grounding |
| core_overall_display | number | 総合表示スコア(誠実性不合格時は74で上限) |
v5 互換フィールド(2026-06-30 以降サポート終了)
| フィールド | ステータス | 説明 |
|---|---|---|
| coding | deprecated · sunset 2026-06-30 | コーディングスコア(旧)、execution_raw に移行してください |
| knowledge | deprecated · sunset 2026-06-30 | 知識総合スコア (v5)、v6 で複数ディメンションに分割 |
| longctx | deprecated · sunset 2026-06-30 | 長文コンテキストスコア (v5)、grounding_raw に移行してください |
| overall | deprecated · sunset 2026-06-30 | 総合スコア(旧)、core_overall_display に移行してください |
| official_coding | deprecated · sunset 2026-06-30 | 公式コーディングスコア(旧)、execution_raw に移行してください |
| official_knowledge | deprecated · sunset 2026-06-30 | 公式知識総合スコア (v5)、v6 で複数ディメンションに分割 |
| official_longctx | deprecated · sunset 2026-06-30 | 公式長文コンテキストスコア (v5)、grounding_raw に移行してください |
| official_overall | deprecated · sunset 2026-06-30 | 公式総合スコア(旧)、core_overall_display に移行してください |
| shadow_* | deprecated · sunset 2026-06-30 | すべての shadow_ プレフィックスフィールドは非推奨 |
フィールドの違い
integrity_label vs integrity_raw:integrity_label は分類ラベル(pass/warn/fail)、integrity_raw は 0-100 の生スコア。ビジネス判断には label、トレンド分析には raw を使用。
core_overall_display vs core_overall_raw:display はフロント表示スコア(integrity fail 時は 74 で上限)、raw は上限なしの加重スコア。ソートには display を使用。
ウィジェット埋め込みコンポーネント
1行のコードでYZ指数をあなたのサイトに埋め込めます。ランキング、モデルバッジ、変動速報の3種類のウィジェットをdark/lightテーマで提供。
ウィジェット: ランキングカード
Top Nモデルのランキング、スコア、順位変動を表示します。
埋め込みコード
設定属性
| 属性 | 説明 | デフォルト値 |
|---|---|---|
| data-type | leaderboard | — |
| data-limit | 表示モデル数 | 5 |
| data-theme | dark または light | dark |
ライブプレビュー
ウィジェット: モデルバッジ
モデル名、総合スコア、順位を表示するコンパクトなバッジウィジェット。GitHub starsバッジに似ています。
埋め込みコード
設定属性
| 属性 | 説明 |
|---|---|
| data-type | badge |
| data-model | モデル slug(必須)、例: deepseek-v3, claude-opus-4.6 |
ライブプレビュー
ウィジェット: 変動速報
今期の最大上昇・下降モデルとインシデント数を表示します。
埋め込みコード
ライブプレビュー
利用可能なモデルslug
| モデル名 | slug | プロバイダ |
|---|---|---|
| Claude Opus 4.6 | claude-opus-4.6 | claude |
| Claude Sonnet 4.6 | claude-sonnet-4.6 | claude |
| GPT-4o | gpt-4o | gpt |
| GPT-o3 | gpt-o3 | gpt |
| Grok 3 | grok-3 | grok |
| Gemini 2.5 Pro | gemini-2.5-pro | gemini |
| DeepSeek V3 | deepseek-v3 | deepseek |
| DeepSeek R1 | deepseek-r1 | deepseek |
| Qwen Max | qwen-max | qwen |
| 豆包 Pro | doubao-pro | doubao |
| 文心一言 4.0 | ernie-4 | ernie |