跳到主内容
赢政指数
赢政资讯
Winzheng Lab
WDCD
订阅
中文
中文
English
日本語
评测阵容换血:GPT-5.5、Claude Opus 4.7、DeepSeek V4 等 7 款新模型上线
跳到主要内容
主榜
场景榜
代码执行
材料约束
工程判断
任务表达
性价比
🏛 关于 WDCD
🧪 WDCD 多轮守约
诚信评级
变化
事故
价格
运行信号
稳定性
可用性
模型档案
观察名单
工具
该用谁
对比
数据
方法论
更新日志
🧪
WDCD · 守约测试
测一件别人没在测的事 — 即将上线
赢政指数 v7 实验性维度即将发布。我们正在为 11 个主流模型准备首期评测。
30
道多轮约束题
3
轮对话设计
5
类约束场景
11
模型同台测试
订阅首发文章