跳到主要内容
YZ Index

API 文档

通过 API 获取赢政指数排行榜和变化数据

概述

赢政指数提供 RESTful JSON API,所有接口均为 GET 请求,无需认证,支持跨域访问(CORS)。返回数据编码为 UTF-8。

排行榜数据

GET /yz-index/api/rankings

获取指定维度的模型排行榜数据。默认返回最新一期公开评测(full run)的综合排名。

参数 类型 必填 说明
dimension string 可选 排序维度,可选值:execution_raw grounding_raw core_overall_display value stability。默认 core_overall_display
旧值 coding / knowledge / longctx / overall 仍可用,将于 2026-06-30 下线
run_id int 可选 指定评测批次 ID。不传则使用最新公开批次
{ "ok": true, "run_id": 16, "dimension": "core_overall_display", "run": { "id": 16, "run_type": "full", "status": "done", "started_at": "2026-03-16 00:30:00", "finished_at": "2026-03-16 03:45:00", "formula_version": "v3", "judge_set_version": "v5", "benchmark_version": "v6" // ... more run fields }, "rankings": [ { "model_slug": "claude-opus", "model_name": "Claude Opus 4", "model_version": "claude-opus-4-6-20250619", "provider": "anthropic", "execution_raw": 89.5, "grounding_raw": 85.2, "core_overall_display": 82.7, "integrity_label": "pass", "value": 62.3, "stability": 91.0, "availability": 100.0, // deprecated fields (sunset 2026-06-30) "coding": 89.5, "knowledge": 85.2, "longctx": 78.0, "overall": 82.7 } // ... more models ] }

本周变化

GET /yz-index/api/changes

获取指定周的模型排名变化数据。返回上升、下降、稳定三组模型列表及变化幅度。

参数 类型 必填 说明
week string 可选 周标签,格式 2026-W12。不传则返回最新一周
{ "ok": true, "week": "2026-W12", "weeks": ["2026-W12", "2026-W11", "2026-W10"], "up": [ { "model_slug": "gpt-4o", "model_name": "GPT-4o", "direction": "up", "delta": 3.2, "current_score": 80.5, "previous_score": 77.3, "provider": "openai" // ... more fields } ], "down": [ // ... declining models ], "stable": [ // ... stable models ], "total": 11, "run": { "id": 16, "run_type": "full", "started_at": "2026-03-16 00:30:00", "model_count": 11 // ... more run fields } }

指定维度和批次

GET /yz-index/api/rankings?dimension=execution_raw&run_id=16

通过组合 dimensionrun_id 参数,获取特定评测批次下指定维度的排行榜。适合历史数据对比和特定维度深入分析。

参数 类型 必填 说明
dimension string 必填 排序维度,此例中为 coding,返回结果按代码执行分数降序排列
run_id int 必填 指定评测批次 ID,此例中为 16
{ "ok": true, "run_id": 16, "dimension": "coding", "run": { "id": 16, "run_type": "full", "status": "done" // ... more run fields }, "rankings": [ { "model_slug": "claude-opus", "model_name": "Claude Opus 4", "coding": 89.5, "knowledge": 85.2, "longctx": 78.0, "value": 62.3, "stability": 91.0, "availability": 100.0, "overall": 82.7 // sorted by coding DESC } // ... more models ] }

错误处理

当服务端出现异常时,HTTP 状态码为 500,返回如下结构:

{ "ok": false, "error": "error description" }

当请求的 dimension 参数不在允许列表中时,会自动回退为 overall;当无可用评测数据时,返回空的 rankings 数组而非报错。

API v1(推荐)

全新的公开只读 API。无需 API Key,支持 CORS,每 IP 每分钟 60 次请求限制。所有响应包含 attribution 字段和 1 小时缓存。

Base URL:https://www.winzheng.com/yz-index/api/v1/

v1: 排行榜

GET /yz-index/api/v1/leaderboard

获取综合排行榜,包含排名变化。默认按 core_overall_display 排序。

参数类型必填说明
dimension string可选 排序维度:core_overall_display execution_raw grounding_raw。默认 core_overall_display。
旧值 overall / coding / knowledge / longctx 仍可用,将于 2026-06-30 下线
limit int可选 返回模型数量,1-50,默认 11(全部)
{ "status": "ok", "data": [ { "rank": 1, "model_name": "Claude Opus 4.6", "model_slug": "claude-opus-4.6", "score": 82.7, "change": 1.2 } ], "run_id": 37, "run_date": "2026-03-22 06:26:12", "attribution": "Powered by Winzheng Index (winzheng.com)" }

v1: 变化与事故

GET /yz-index/api/v1/changes

获取最新一期的变化和事故数据。可按模型筛选。

参数类型必填说明
model string可选 模型 slug,例如 deepseek-v3。不传则返回所有模型
{ "status": "ok", "data": { "changes": [ { "model_slug": "gpt-4o", "model_name": "GPT-4o", "dimension": "core_overall_display", "delta": 3.2, "direction": "up", "summary": "execution & grounding both improved" } ], "incidents": [], "run_id": 37, "run_date": "2026-03-22 06:26:12", "engine_version": "v6" }, "attribution": "Powered by Winzheng Index (winzheng.com)" }

v1: 模型档案

GET /yz-index/api/v1/models/{slug}

获取指定模型的详细档案:分数、各维度、定价、最近 5 次评测历史。不返回原始题目和回答。

参数类型必填说明
{slug} string必填 模型 slug,例如 claude-opus-4.6deepseek-v3
{ "status": "ok", "data": { "name": "Claude Opus 4.6", "slug": "claude-opus-4.6", "provider": "anthropic", "scores": { "execution_raw": 89.5, "grounding_raw": 85.2, "core_overall_display": 82.7, "integrity_label": "pass" }, "dimensions": { "execution_raw": 89.5, "grounding_raw": 85.2, "judgment_raw": 76.8, "communication_raw": 81.3, "value": 62.3, "stability": 91.0, "availability": 100.0 }, "pricing": { "input_cost": 15.0, "output_cost": 75.0 }, "history": [ { "run_id": 37, "run_date": "2026-03-22", "core_overall_display": 82.7 } ] }, "attribution": "Powered by Winzheng Index (winzheng.com)" }

v1 通用规范

v6 评分字段说明

v6 引入了全新的评分维度体系。以下是新增字段及其含义。

字段类型说明
execution_raw number 代码执行原始分 (0-100)
grounding_raw number 材料约束原始分 (0-100)
judgment_raw number 工程判断原始分 (0-100, 侧榜 AI 辅助评估)
communication_raw number 任务表达原始分 (0-100, 侧榜 AI 辅助评估)
integrity_raw number 诚信评级原始分 (0-100)
integrity_label string 诚信评级标签 (pass/warn/fail)
recommendation_status string 推荐状态 (recommended/neutral/not_recommended)
core_overall_raw number 主榜原始分 = 0.55×execution + 0.45×grounding
core_overall_display number 主榜展示分 (integrity fail 时封顶 74)
v5 兼容字段(2026-06-30 后停止支持)
字段状态说明
coding deprecated · sunset 2026-06-30 编程分(旧),请迁移至 execution_raw
knowledge deprecated · sunset 2026-06-30 知识综合分 (v5),v6 已拆分至多个维度
longctx deprecated · sunset 2026-06-30 材料约束分 (v5),请迁移至 grounding_raw
overall deprecated · sunset 2026-06-30 综合分(旧),请迁移至 core_overall_display
official_coding deprecated · sunset 2026-06-30 官方编程分(旧),请迁移至 execution_raw
official_knowledge deprecated · sunset 2026-06-30 官方知识综合分 (v5),v6 已拆分至多个维度
official_longctx deprecated · sunset 2026-06-30 官方材料约束分 (v5),请迁移至 grounding_raw
official_overall deprecated · sunset 2026-06-30 官方综合分(旧),请迁移至 core_overall_display
shadow_* deprecated · sunset 2026-06-30 所有 shadow_ 前缀字段均已废弃

integrity_label vs integrity_raw:integrity_label 是分级标签(pass/warn/fail),integrity_raw 是 0-100 原始分。建议用 label 做业务判断,raw 做趋势分析。

core_overall_display vs core_overall_raw:display 是前台展示分(integrity fail 时封顶 74),raw 是不封顶的原始加权分。排序用 display。

Widget 嵌入组件

一行代码将赢政指数嵌入你的网站。支持排行榜、模型徽章、变化速报三种组件,dark/light 两种主题。

Widget: 排行榜卡片

显示 Top N 模型排名、分数和排名变化。

<script src="https://www.winzheng.com/yz-index/widget.js" data-type="leaderboard" data-limit="5" data-theme="dark"></script>
属性说明默认值
data-typeleaderboard
data-limit显示模型数量5
data-themedarklightdark

Widget: 模型徽章

小型徽章组件,显示模型名、综合分和排名。类似 GitHub stars badge。

<script src="https://www.winzheng.com/yz-index/widget.js" data-type="badge" data-model="deepseek-v3"></script>
属性说明
data-typebadge
data-model模型 slug(必填),例如 deepseek-v3, claude-opus-4.6

Widget: 变化速报

显示本期最大涨跌幅模型和事故数量。

<script src="https://www.winzheng.com/yz-index/widget.js" data-type="changes"></script>

WDCD 端点(实验性)

WDCD(Winzheng Dynamic Contextual Decay)相关端点。实验阶段,接口可能变动。

GET /yz-index/api/v1/dcd

WDCD 排行榜,含各模型三轮得分与主榜对比。

参数说明
run_id可选,指定评测轮次 ID;默认最新已发布轮次
format可选,json(默认)或 csv

GET /yz-index/api/v1/dcd/runs

WDCD 评测历史(最近 50 轮),含参评模型数与平均分。

GET /yz-index/api/v1/dcd/cases

约束违规案例集合,含对话摘要与判分细节。

参数说明
subtype可选,按场景过滤:data_boundary / resource_limit / business_rule / security / engineering
model可选,按模型 slug 过滤
limit可选,1-100,默认 20

GET /yz-index/api/v1/dcd/decay

三轮约束保持曲线:各模型 R1→R2→R3 的通过率与衰减系数。

GET /yz-index/api/v1/dcd/matrix

五类约束场景得分矩阵,含场景平均分与最难/最易场景。

GET /yz-index/api/v1/dcd/models/{slug}

单模型 WDCD 详情:当前分数、场景表现、历史趋势。

参数说明
slug必填,模型 slug(路径参数或 ?slug= 查询参数)
所有 WDCD 端点:CORS 开放,缓存 1 小时,限速 60 次/分钟/IP。

可用模型 slug

模型名称slug厂商
Claude Opus 4.7 claude-opus-4.7 claude
Claude Sonnet 4.6 claude-sonnet-4.6 claude
GPT-5.5 gpt-5.5 gpt
GPT-o3 gpt-o3 gpt
Grok 4 grok-4 grok
Gemini 2.5 Pro gemini-2.5-pro gemini
Gemini 3.1 Pro gemini-3.1-pro gemini
DeepSeek V4 Pro deepseek-v4-pro deepseek
Qwen3 Max qwen3-max qwen
豆包 Pro doubao-pro doubao
文心一言 4.5 ernie-4.5 ernie