Claude Opus 4.6稳定性暴跌22.5分:当AI遇到真实运维场景就现原形 Claude Opus 4.6本周测评稳定性维度暴跌22.5分至31分,在多个涉及真实工程判断的运维场景全军覆没。编程能力虽提升42分,但面对需要经验和直觉的故障诊断时,模型暴露出致命短板。