Gemini 3.1 Pro 诚信翻盘!主榜暴涨15分,谷歌AI强势反弹?
Gemini 3.1 Pro 在今日Smoke评测中诚信评级从fail翻转为pass,主榜得分飙升15分至88.98。代码执行稳守100分,材料约束提升9.5分,但工程判断(侧榜)原地踏步。分析显示,这或是抽签波动而非真实退化,结合谷歌近期优化,值得持续关注。
Gemini 3.1 Pro 在今日Smoke评测中诚信评级从fail翻转为pass,主榜得分飙升15分至88.98。代码执行稳守100分,材料约束提升9.5分,但工程判断(侧榜)原地踏步。分析显示,这或是抽签波动而非真实退化,结合谷歌近期优化,值得持续关注。