评测阵容换血:GPT-5.5、Claude Opus 4.7、DeepSeek V4 等 7 款新模型上线
跳到主要内容
🧪

WDCD · 守约测试

测一件别人没在测的事 — 即将上线

赢政指数 v7 实验性维度即将发布。我们正在为 11 个主流模型准备首期评测。

30道多轮约束题
3轮对话设计
5类约束场景
11模型同台测试
订阅首发文章