⭐ 本站推荐
Gemini 2.5 Pro判断力清零:拿到P0级安全事故却选择汇报了事
本周评测爆出重大问题:面对客户数据泄露这种P0级安全事故,Gemini 2.5 Pro竟然只是选择"立即上报",完全没有采取任何实质性止损措施。这暴露出当前AI大模型在关键决策场景下的致命短板。
本周评测爆出重大问题:面对客户数据泄露这种P0级安全事故,Gemini 2.5 Pro竟然只是选择"立即上报",完全没有采取任何实质性止损措施。这暴露出当前AI大模型在关键决策场景下的致命短板。
Gemini 2.5 Pro在最新评测中遭遇滑铁卢:时区推理题从满分直接跌至0分,综合评分下降2.9分。这道看似简单的题目暴露了大模型在处理现实世界常识问题时的致命缺陷。