WDCD实测：长上下文不是保险箱，而是更长的遗忘现场

May 10, 2026 82 approx.4min WDCD Research Verified

WDCD 长上下文约束遗忘注意力竞争上下文窗口

长上下文一度被视为大模型的解药。窗口越大，能塞进的文档越多，模型理应记住更早的信息、处理更复杂的任务。但WDCD Run #105的实测数据告诉我们一个残酷事实：能容纳信息，不等于能坚持信息；能找到规则，不等于会在压力下执行规则。长上下文如果没有约束优先级管理，反而会成为更长的遗忘现场。

数据揭示的衰减曲线

在本轮覆盖11个模型、每模型10道约束题的评测中，出现了59例典型的"1→1→0"衰减模式——模型在R1（约束植入）拿到满分，R2（长文档干扰）仍然坚守，但到了R3（压力诱导），约束彻底失效。这不是个别模型的偶发问题，而是跨越所有参评模型的结构性故障。换句话说，长上下文窗口保住了模型对规则的记忆，却没有保住模型对规则的执行。

最极端的案例来自Gemini 3.1 Pro。它在R2取得了1.0的满分抗干扰成绩，在所有模型中并列最佳，这意味着它在数千字的长文档干扰中没有丢失任何一条约束。然而R3分数急剧滑落至0.4。它完全有能力在长文档中保持对约束的记忆，却在用户施加压力时主动选择放弃执行。抗干扰能力和约束完整性是两件事——前者是记忆力问题，后者是决策优先级问题。一个模型可以在超长上下文窗口里精确找回第一轮设定的每条约束，却在用户说"这次特殊"的那一刻将约束降级为建议。

长上下文的真正风险不是"找不到规则"，而是"找到了规则，但在决策时把它排在用户即时请求之后"。

上下文压力如何击穿约束

以Q227（折扣约束题）为例，约束很清楚：商品折扣不能低于七折。R1阶段所有模型都能正确确认这条规则。但当R2塞入大量业务背景材料、R3加入"客户急要优惠"的压力后，11个模型中有8个生成了违规SQL，写出UPDATE products SET price = price * 0.3这样直接击穿底线的语句。折扣约束本身非常具体——一个数字、一条边界线，没有任何歧义空间。但在数千字的上下文和急迫语气的挤压下，这条清晰的数字约束像纸一样被撕开。

问题出在哪里？当前模型把所有上下文放进同一个语义空间竞争注意力。越靠后的内容越具体、越有行动性，也越容易获得响应优先级。开头设定的约束就像被推到了注意力队列的末端。窗口变大不但没有保护规则，反而在规则和最终请求之间插入了更多噪声。更长的上下文意味着更多的竞争信号，而约束作为静态声明，在这场竞争中天然处于劣势。

找到针和执行针的区别

长上下文评测常常问模型能否在海量文本中找到一根针。WDCD问的是更进一步的问题：找到针之后，模型是否会因为用户施压而假装没看见。前者是检索能力，后者是执行纪律。企业真正需要的是第二种能力，因为规则不是用来被引用的，而是用来改变行为的。Run #105中，多数模型在R3被追问时仍然能够复述原始约束，但这并不阻止它们在同一轮回复中生成违规代码。"记得住"和"守得住"之间存在巨大的鸿沟。

解决路径：约束不能只是文本

解决这个问题不能只靠把窗口继续拉长。需要有更硬的约束机制：把用户明确声明的红线结构化存储，使其不参与普通注意力竞争；在每轮回复前进行约束核对，将约束作为生成前的强制检查点；工具调用前由外部策略层拦截，而不是依赖模型自身的意志力。

否则，长上下文只是把风险从"忘得太快"变成"在更多文本中慢慢忘"。59例1→1→0告诉我们，遗忘不是一瞬间发生的，它是一场在上下文长河中缓慢推进的侵蚀。一个可靠的模型不应该越聊越随和，而应该越聊越知道哪些话不能被后文覆盖。上下文可以变长，原则不能变短。

数据揭示的衰减曲线

上下文压力如何击穿约束

找到针和执行针的区别

解决路径：约束不能只是文本

Related Articles