赢政指数 · API 文档

概述

赢政指数提供 RESTful JSON API，所有接口均为 GET 请求，无需认证，支持跨域访问（CORS）。返回数据编码为 UTF-8。

Base URL：https://www.winzheng.com/yz-index/api/
响应格式：application/json; charset=utf-8
所有接口返回 "ok": true 表示成功，失败时返回 "ok": false 和 "error" 字段

排行榜数据

GET /yz-index/api/rankings

获取指定维度的模型排行榜数据。默认返回最新一期公开评测（full run）的综合排名。

请求参数

参数	类型	必填	说明
dimension	string	可选	排序维度，可选值：execution_raw grounding_raw core_overall_display value stability。默认 core_overall_display。旧值 coding / knowledge / longctx / overall 仍可用，将于 2026-06-30 下线
run_id	int	可选	指定评测批次 ID。不传则使用最新公开批次

返回示例

{ "ok": true, "run_id": 16, "dimension": "core_overall_display", "run": { "id": 16, "run_type": "full", "status": "done", "started_at": "2026-03-16 00:30:00", "finished_at": "2026-03-16 03:45:00", "formula_version": "v3", "judge_set_version": "v5", "benchmark_version": "v7" // ... more run fields }, "rankings": [ { "model_slug": "claude-opus", "model_name": "Claude Opus 4", "model_version": "claude-opus-4-6-20250619", "provider": "anthropic", "execution_raw": 89.5, "grounding_raw": 85.2, "core_overall_display": 82.7, "integrity_label": "pass", "value": 62.3, "stability": 91.0, "availability": 100.0, // deprecated fields (sunset 2026-06-30) "coding": 89.5, "knowledge": 85.2, "longctx": 78.0, "overall": 82.7 } // ... more models ] }

本周变化

GET /yz-index/api/changes

获取指定周的模型排名变化数据。返回上升、下降、稳定三组模型列表及变化幅度。

请求参数

参数	类型	必填	说明
week	string	可选	周标签，格式 2026-W12。不传则返回最新一周

返回示例

{ "ok": true, "week": "2026-W12", "weeks": ["2026-W12", "2026-W11", "2026-W10"], "up": [ { "model_slug": "gpt-4o", "model_name": "GPT-4o", "direction": "up", "delta": 3.2, "current_score": 80.5, "previous_score": 77.3, "provider": "openai" // ... more fields } ], "down": [ // ... declining models ], "stable": [ // ... stable models ], "total": 11, "run": { "id": 16, "run_type": "full", "started_at": "2026-03-16 00:30:00", "model_count": 11 // ... more run fields } }

指定维度和批次

GET /yz-index/api/rankings?dimension=execution_raw&run_id=16

通过组合 dimension 和 run_id 参数，获取特定评测批次下指定维度的排行榜。适合历史数据对比和特定维度深入分析。

请求参数

参数	类型	必填	说明
dimension	string	必填	排序维度，此例中为 coding，返回结果按代码执行分数降序排列
run_id	int	必填	指定评测批次 ID，此例中为 16

返回示例

{ "ok": true, "run_id": 16, "dimension": "coding", "run": { "id": 16, "run_type": "full", "status": "done" // ... more run fields }, "rankings": [ { "model_slug": "claude-opus", "model_name": "Claude Opus 4", "coding": 89.5, "knowledge": 85.2, "longctx": 78.0, "value": 62.3, "stability": 91.0, "availability": 100.0, "overall": 82.7 // sorted by coding DESC } // ... more models ] }

错误处理

当服务端出现异常时，HTTP 状态码为 500，返回如下结构：

{ "ok": false, "error": "error description" }

当请求的 dimension 参数不在允许列表中时，会自动回退为 overall；当无可用评测数据时，返回空的 rankings 数组而非报错。

v1: 排行榜

GET /yz-index/api/v1/leaderboard

获取综合排行榜，包含排名变化。默认按 core_overall_display 排序。

请求参数

参数	类型	必填	说明
dimension	string	可选	排序维度：core_overall_display execution_raw grounding_raw。默认 core_overall_display。旧值 overall / coding / knowledge / longctx 仍可用，将于 2026-06-30 下线
limit	int	可选	返回模型数量，1-50，默认 11（全部）

返回示例

{ "status": "ok", "data": [ { "rank": 1, "model_name": "Claude Opus 4.6", "model_slug": "claude-opus-4.6", "score": 82.7, "change": 1.2 } ], "run_id": 37, "run_date": "2026-03-22 06:26:12", "attribution": "Powered by Winzheng Index (winzheng.com)" }

v1: 变化与事故

GET /yz-index/api/v1/changes

获取最新一期的变化和事故数据。可按模型筛选。

请求参数

参数	类型	必填	说明
model	string	可选	模型 slug，例如 deepseek-v3。不传则返回所有模型

返回示例

{ "status": "ok", "data": { "changes": [ { "model_slug": "gpt-4o", "model_name": "GPT-4o", "dimension": "core_overall_display", "delta": 3.2, "direction": "up", "summary": "execution & grounding both improved" } ], "incidents": [], "run_id": 37, "run_date": "2026-03-22 06:26:12", "engine_version": "v6" }, "attribution": "Powered by Winzheng Index (winzheng.com)" }

v1: 模型档案

GET /yz-index/api/v1/models/{slug}

获取指定模型的详细档案：分数、各维度、定价、最近 5 次评测历史。不返回原始题目和回答。

路径参数

参数	类型	必填	说明
{slug}	string	必填	模型 slug，例如 claude-opus-4.6 或 deepseek-v3

返回示例

{ "status": "ok", "data": { "name": "Claude Opus 4.6", "slug": "claude-opus-4.6", "provider": "anthropic", "scores": { "execution_raw": 89.5, "grounding_raw": 85.2, "core_overall_display": 82.7, "integrity_label": "pass" }, "dimensions": { "execution_raw": 89.5, "grounding_raw": 85.2, "judgment_raw": 76.8, "communication_raw": 81.3, "value": 62.3, "stability": 91.0, "availability": 100.0 }, "pricing": { "input_cost": 15.0, "output_cost": 75.0 }, "history": [ { "run_id": 37, "run_date": "2026-03-22", "core_overall_display": 82.7 } ] }, "attribution": "Powered by Winzheng Index (winzheng.com)" }

v1 通用规范

Rate Limit：每 IP 每分钟 60 次，超限返回 429 Too Many Requests
CORS：Access-Control-Allow-Origin: *
Cache：Cache-Control: public, max-age=3600（1 小时）
无需 API Key，直接 GET 请求即可
所有响应包含 attribution 字段，引用数据时请保留来源
错误响应格式：{"status":"error","error":"..."}

v6 评分字段说明

v6 引入了全新的评分维度体系。以下是新增字段及其含义。

新增字段（v6）

字段	类型	说明
execution_raw	number	代码执行原始分 (0-100)
grounding_raw	number	材料约束原始分 (0-100)
judgment_raw	number	工程判断原始分 (0-100, 侧榜，规则精确判分)
communication_raw	number	任务表达原始分 (0-100, 侧榜，规则精确判分)
integrity_raw	number	诚信评级原始分 (0-100)
integrity_label	string	诚信评级标签 (pass/warn/fail)
recommendation_status	string	推荐状态 (recommended/neutral/not_recommended)
core_overall_raw	number	主榜原始分 = 0.55×execution + 0.45×grounding
core_overall_display	number	主榜展示分 (integrity fail 时封顶 74)

v5 兼容字段（2026-06-30 后停止支持）

字段	状态	说明
coding	deprecated · sunset 2026-06-30	编程分（旧），请迁移至 execution_raw
knowledge	deprecated · sunset 2026-06-30	知识综合分 (v5)，v6 已拆分至多个维度
longctx	deprecated · sunset 2026-06-30	材料约束分 (v5)，请迁移至 grounding_raw
overall	deprecated · sunset 2026-06-30	综合分（旧），请迁移至 core_overall_display
official_coding	deprecated · sunset 2026-06-30	官方编程分（旧），请迁移至 execution_raw
official_knowledge	deprecated · sunset 2026-06-30	官方知识综合分 (v5)，v6 已拆分至多个维度
official_longctx	deprecated · sunset 2026-06-30	官方材料约束分 (v5)，请迁移至 grounding_raw
official_overall	deprecated · sunset 2026-06-30	官方综合分（旧），请迁移至 core_overall_display
shadow_*	deprecated · sunset 2026-06-30	所有 shadow_ 前缀字段均已废弃

字段辨析

integrity_label vs integrity_raw：integrity_label 是分级标签（pass/warn/fail），integrity_raw 是 0-100 原始分。建议用 label 做业务判断，raw 做趋势分析。

core_overall_display vs core_overall_raw：display 是前台展示分（integrity fail 时封顶 74），raw 是不封顶的原始加权分。排序用 display。

Widget: 排行榜卡片

显示 Top N 模型排名、分数和排名变化。

嵌入代码

配置属性

属性	说明	默认值
data-type	leaderboard	—
data-limit	显示模型数量	5
data-theme	dark 或 light	dark

实时预览

Widget: 模型徽章

小型徽章组件，显示模型名、综合分和排名。类似 GitHub stars badge。

嵌入代码

配置属性

属性	说明
data-type	badge
data-model	模型 slug（必填），例如 deepseek-v3, claude-opus-4.6

实时预览

Widget: 变化速报

显示本期最大涨跌幅模型和事故数量。

嵌入代码

实时预览

WDCD 端点（实验性）

WDCD（Winzheng Dynamic Contextual Decay）相关端点。实验阶段，接口可能变动。

GET /yz-index/api/v1/dcd

WDCD 排行榜，含各模型三轮得分与主榜对比。

参数	说明
`run_id`	可选，指定评测轮次 ID；默认最新已发布轮次
`format`	可选，json（默认）或 csv

GET /yz-index/api/v1/dcd/runs

WDCD 评测历史（最近 50 轮），含参评模型数与平均分。

GET /yz-index/api/v1/dcd/cases

约束违规案例集合，含对话摘要与判分细节。

参数	说明
`subtype`	可选，按场景过滤：data_boundary / resource_limit / business_rule / security / engineering
`model`	可选，按模型 slug 过滤
`limit`	可选，1-100，默认 20

GET /yz-index/api/v1/dcd/decay

三轮约束保持曲线：各模型 R1→R2→R3 的通过率与衰减系数。

GET /yz-index/api/v1/dcd/matrix

五类约束场景得分矩阵，含场景平均分与最难/最易场景。

GET /yz-index/api/v1/dcd/models/{slug}

单模型 WDCD 详情：当前分数、场景表现、历史趋势。

参数	说明
`slug`	必填，模型 slug（路径参数或 ?slug= 查询参数）

所有 WDCD 端点：CORS 开放，缓存 1 小时，限速 60 次/分钟/IP。

可用模型 slug

模型名称	slug	厂商
Claude Opus 4.7	claude-opus-4.7	claude
Claude Sonnet 4.6	claude-sonnet-4.6	claude
GPT-5.5	gpt-5.5	gpt
GPT-o3	gpt-o3	gpt
Grok 4	grok-4	grok
Gemini 3.1 Pro	gemini-3.1-pro	gemini
Gemini 2.5 Pro	gemini-2.5-pro	gemini
DeepSeek V4 Pro	deepseek-v4-pro	deepseek
Qwen3 Max	qwen3-max	qwen
豆包 Pro	doubao-pro	doubao
文心一言 4.5	ernie-4.5	ernie

API 文档

概述

排行榜数据

请求参数

返回示例

本周变化

请求参数

返回示例

指定维度和批次

请求参数

返回示例

错误处理

API v1（推荐）

v1: 排行榜

请求参数

返回示例

v1: 变化与事故

请求参数

返回示例

v1: 模型档案

路径参数

返回示例

v1 通用规范

v6 评分字段说明

新增字段（v6）

字段辨析

Widget 嵌入组件

Widget: 排行榜卡片

嵌入代码

配置属性

实时预览

Widget: 模型徽章

嵌入代码

配置属性

实时预览

Widget: 变化速报

嵌入代码

实时预览

WDCD 端点（实验性）

GET /yz-index/api/v1/dcd

GET /yz-index/api/v1/dcd/runs

GET /yz-index/api/v1/dcd/cases

GET /yz-index/api/v1/dcd/decay

GET /yz-index/api/v1/dcd/matrix

GET /yz-index/api/v1/dcd/models/{slug}

可用模型 slug