Claude 4.6崩了:100分安全题全军覆没背后的致命缺陷
Claude Opus 4.6本周评测出现罕见翻车:在"工程判断力:安全事件响应"测试中从满分直接跌至0分,稳定性暴跌7.6个百分点。原始回答暴露出AI在真实安全场景下的致命盲区——看似专业的标准答案,实则完全忽略了紧急响应的核心要素。
Claude Opus 4.6本周评测出现罕见翻车:在"工程判断力:安全事件响应"测试中从满分直接跌至0分,稳定性暴跌7.6个百分点。原始回答暴露出AI在真实安全场景下的致命盲区——看似专业的标准答案,实则完全忽略了紧急响应的核心要素。
Anthropic于2026年2月20日正式推出Claude Code Security——一款集成于Claude Code网页版的AI安全工具,目前处于有限研究预览阶段。该工具利用Claude Opus 4.6的强大推理能力,可扫描整个代码库,发现传统规则型扫描器常忽略的上下文依赖型漏洞,并直接生成针对性修复补丁(需人工审核)。Anthropic称其已在生产级开源项目中发现超500个此前未知的0-day漏洞。发布后数小时,多家网络安全公司股价暴跌,市场担忧传统AppSec商业模式将被AI结构性替代。开发者社区反响热烈,认为这是安全生产力的重大飞跃,但也担忧补丁可靠性与过度依赖风险。这标志着AI从代码助手向代码安全基础设施的加速转型,或将成为2026年软件安全领域最重要范式转变的开端。