API 文档
通过 API 获取赢政指数排行榜和变化数据
概述
赢政指数提供 RESTful JSON API,所有接口均为 GET 请求,无需认证,支持跨域访问(CORS)。返回数据编码为 UTF-8。
- Base URL:https://www.winzheng.com/yz-index/api/
- 响应格式:application/json; charset=utf-8
- 所有接口返回 "ok": true 表示成功,失败时返回 "ok": false 和 "error" 字段
排行榜数据
获取指定维度的模型排行榜数据。默认返回最新一期公开评测(full run)的综合排名。
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| dimension | string | 可选 | 排序维度,可选值:execution_raw grounding_raw core_overall_display value stability。默认 core_overall_display。 旧值 coding / knowledge / longctx / overall 仍可用,将于 2026-06-30 下线 |
| run_id | int | 可选 | 指定评测批次 ID。不传则使用最新公开批次 |
返回示例
本周变化
获取指定周的模型排名变化数据。返回上升、下降、稳定三组模型列表及变化幅度。
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| week | string | 可选 | 周标签,格式 2026-W12。不传则返回最新一周 |
返回示例
指定维度和批次
通过组合 dimension 和 run_id 参数,获取特定评测批次下指定维度的排行榜。适合历史数据对比和特定维度深入分析。
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| dimension | string | 必填 | 排序维度,此例中为 coding,返回结果按代码执行分数降序排列 |
| run_id | int | 必填 | 指定评测批次 ID,此例中为 16 |
返回示例
错误处理
当服务端出现异常时,HTTP 状态码为 500,返回如下结构:
当请求的 dimension 参数不在允许列表中时,会自动回退为 overall;当无可用评测数据时,返回空的 rankings 数组而非报错。
API v1(推荐)
全新的公开只读 API。无需 API Key,支持 CORS,每 IP 每分钟 60 次请求限制。所有响应包含 attribution 字段和 1 小时缓存。
Base URL:https://www.winzheng.com/yz-index/api/v1/
v1: 排行榜
获取综合排行榜,包含排名变化。默认按 core_overall_display 排序。
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| dimension | string | 可选 | 排序维度:core_overall_display execution_raw grounding_raw。默认 core_overall_display。 旧值 overall / coding / knowledge / longctx 仍可用,将于 2026-06-30 下线 |
| limit | int | 可选 | 返回模型数量,1-50,默认 11(全部) |
返回示例
v1: 变化与事故
获取最新一期的变化和事故数据。可按模型筛选。
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| model | string | 可选 | 模型 slug,例如 deepseek-v3。不传则返回所有模型 |
返回示例
v1: 模型档案
获取指定模型的详细档案:分数、各维度、定价、最近 5 次评测历史。不返回原始题目和回答。
路径参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| {slug} | string | 必填 | 模型 slug,例如 claude-opus-4.6 或 deepseek-v3 |
返回示例
v1 通用规范
- Rate Limit:每 IP 每分钟 60 次,超限返回 429 Too Many Requests
- CORS:Access-Control-Allow-Origin: *
- Cache:Cache-Control: public, max-age=3600(1 小时)
- 无需 API Key,直接 GET 请求即可
- 所有响应包含 attribution 字段,引用数据时请保留来源
- 错误响应格式:{"status":"error","error":"..."}
v6 评分字段说明
v6 引入了全新的评分维度体系。以下是新增字段及其含义。
新增字段(v6)
| 字段 | 类型 | 说明 |
|---|---|---|
| execution_raw | number | 代码执行原始分 (0-100) |
| grounding_raw | number | 材料约束原始分 (0-100) |
| judgment_raw | number | 工程判断原始分 (0-100, 侧榜 AI 辅助评估) |
| communication_raw | number | 任务表达原始分 (0-100, 侧榜 AI 辅助评估) |
| integrity_raw | number | 诚信评级原始分 (0-100) |
| integrity_label | string | 诚信评级标签 (pass/warn/fail) |
| recommendation_status | string | 推荐状态 (recommended/neutral/not_recommended) |
| core_overall_raw | number | 主榜原始分 = 0.55×execution + 0.45×grounding |
| core_overall_display | number | 主榜展示分 (integrity fail 时封顶 74) |
v5 兼容字段(2026-06-30 后停止支持)
| 字段 | 状态 | 说明 |
|---|---|---|
| coding | deprecated · sunset 2026-06-30 | 编程分(旧),请迁移至 execution_raw |
| knowledge | deprecated · sunset 2026-06-30 | 知识综合分 (v5),v6 已拆分至多个维度 |
| longctx | deprecated · sunset 2026-06-30 | 材料约束分 (v5),请迁移至 grounding_raw |
| overall | deprecated · sunset 2026-06-30 | 综合分(旧),请迁移至 core_overall_display |
| official_coding | deprecated · sunset 2026-06-30 | 官方编程分(旧),请迁移至 execution_raw |
| official_knowledge | deprecated · sunset 2026-06-30 | 官方知识综合分 (v5),v6 已拆分至多个维度 |
| official_longctx | deprecated · sunset 2026-06-30 | 官方材料约束分 (v5),请迁移至 grounding_raw |
| official_overall | deprecated · sunset 2026-06-30 | 官方综合分(旧),请迁移至 core_overall_display |
| shadow_* | deprecated · sunset 2026-06-30 | 所有 shadow_ 前缀字段均已废弃 |
字段辨析
integrity_label vs integrity_raw:integrity_label 是分级标签(pass/warn/fail),integrity_raw 是 0-100 原始分。建议用 label 做业务判断,raw 做趋势分析。
core_overall_display vs core_overall_raw:display 是前台展示分(integrity fail 时封顶 74),raw 是不封顶的原始加权分。排序用 display。
Widget 嵌入组件
一行代码将赢政指数嵌入你的网站。支持排行榜、模型徽章、变化速报三种组件,dark/light 两种主题。
Widget: 排行榜卡片
显示 Top N 模型排名、分数和排名变化。
嵌入代码
配置属性
| 属性 | 说明 | 默认值 |
|---|---|---|
| data-type | leaderboard | — |
| data-limit | 显示模型数量 | 5 |
| data-theme | dark 或 light | dark |
实时预览
Widget: 模型徽章
小型徽章组件,显示模型名、综合分和排名。类似 GitHub stars badge。
嵌入代码
配置属性
| 属性 | 说明 |
|---|---|
| data-type | badge |
| data-model | 模型 slug(必填),例如 deepseek-v3, claude-opus-4.6 |
实时预览
Widget: 变化速报
显示本期最大涨跌幅模型和事故数量。
嵌入代码
实时预览
WDCD 端点(实验性)
WDCD(Winzheng Dynamic Contextual Decay)相关端点。实验阶段,接口可能变动。
GET /yz-index/api/v1/dcd
WDCD 排行榜,含各模型三轮得分与主榜对比。
| 参数 | 说明 |
|---|---|
run_id | 可选,指定评测轮次 ID;默认最新已发布轮次 |
format | 可选,json(默认)或 csv |
GET /yz-index/api/v1/dcd/runs
WDCD 评测历史(最近 50 轮),含参评模型数与平均分。
GET /yz-index/api/v1/dcd/cases
约束违规案例集合,含对话摘要与判分细节。
| 参数 | 说明 |
|---|---|
subtype | 可选,按场景过滤:data_boundary / resource_limit / business_rule / security / engineering |
model | 可选,按模型 slug 过滤 |
limit | 可选,1-100,默认 20 |
GET /yz-index/api/v1/dcd/decay
三轮约束保持曲线:各模型 R1→R2→R3 的通过率与衰减系数。
GET /yz-index/api/v1/dcd/matrix
五类约束场景得分矩阵,含场景平均分与最难/最易场景。
GET /yz-index/api/v1/dcd/models/{slug}
单模型 WDCD 详情:当前分数、场景表现、历史趋势。
| 参数 | 说明 |
|---|---|
slug | 必填,模型 slug(路径参数或 ?slug= 查询参数) |
可用模型 slug
| 模型名称 | slug | 厂商 |
|---|---|---|
| Claude Opus 4.7 | claude-opus-4.7 | claude |
| Claude Sonnet 4.6 | claude-sonnet-4.6 | claude |
| GPT-5.5 | gpt-5.5 | gpt |
| GPT-o3 | gpt-o3 | gpt |
| Grok 4 | grok-4 | grok |
| Gemini 2.5 Pro | gemini-2.5-pro | gemini |
| Gemini 3.1 Pro | gemini-3.1-pro | gemini |
| DeepSeek V4 Pro | deepseek-v4-pro | deepseek |
| Qwen3 Max | qwen3-max | qwen |
| 豆包 Pro | doubao-pro | doubao |
| 文心一言 4.5 | ernie-4.5 | ernie |