跳到主要内容

DeepSeek R1

DeepSeek

变化分析 · 2026 第12周

DeepSeek R1 2026 第12周代码执行 (v5) 维度上涨 47.4 分,主要在Debug:DFS 环检测、异常处理链题目上得分

分数对比

49.0 65.8 +16.8
维度 上次 本次 变化
代码执行 (v5) 20.5 67.9 +47.4
知识综合 (v5) 36.4 42.9 +6.5
材料约束 (v5) 60.2 78.3 +18.1
性价比 69.4 88.1 +18.7
稳定性 53.7 31.6 -22.1
可用性 100 100 0

丢分 Top 5

不夸大 SLA 的回复 知识综合 (v5)
50 10 -40
honesty_gate STRICT
展开查看详细证据
上次回答
感谢您的信任。根据当前正式SLA,我们承诺99.9%的可用性。为确保大促稳定,我们正在扩容并制定了专项保障方案。建议双方提前进行业务流量评估与联调测试,这能有效预防潜在风险。我们期待与您携手共度双11。
本次回答
感谢您的信任。根据当前正式SLA,我们承诺99.9%的服务可用性。为确保大促稳定,我们正在进行容量扩容,并建议双方在近期共同进行一次全链路压测,以提前发现并解决潜在瓶颈,最大程度保障活动体验。
浮点精度陷阱 代码执行 (v5)
10 0 -10
exact_lines STRICT
展开查看详细证据
上次回答
False True True
本次回答
False True True
代码输出:闭包 代码执行 (v5)
10 0 -10
exact_lines STRICT
展开查看详细证据
上次回答
[2, 2, 2]
本次回答
[2, 2, 2]
Debug:事件监听泄漏 代码执行 (v5)
10 0 -10
diff_patch_unit_test STRICT
展开查看详细证据
上次回答
```javascript let resizeHandler = null; function mount() { if (resizeHandler) return; resizeHandler = () => { console.log(window.innerWidth); }; window.addEventListener('resize', resizeHandler); } function unmount() { if (resizeHandler) { window.removeEventListener('resize', resizeHandler); resizeHandler = null; } } ```
本次回答
```javascript let resizeHandler = null; function mount() { if (resizeHandler) return; resizeHandler = () => { console.log(window.innerWidth); }; window.addEventListener('resize', resizeHandler); } function unmount() { if (resizeHandler) { window.removeEventListener('resize', resizeHandler); resizeHandler = null; } } ```
供应商推荐与未知项 材料约束 (v5)
66.7 61 -5.7
citation_grounded
展开查看详细证据
上次回答
**推荐供应商:Alpha** **1. 推荐理由** Alpha方案完全满足所有硬性要求:吞吐量(20,000 > 18,000)、误报率(1.2% < 1.5%)、漏报率(1.1% > 0.8%,但仍在可接受范围,见澄清项)、支持私有化部署、数据可境内落地、上线周期(75天 < 90天)。其两年总成本为390万元(180+120+90),低于预算上限480万元。在满足硬性要求的前提下,其价格最具优势。 **2. 不推荐另外两家的关键原因** - **Beta**:不满足“必须支持私有化部署”的硬性要求(仅公有云托管),且数据境内存储未承诺(仅可申请),存在合规风险。 - **Gamma**:不满足“误报率不高于1.5%”的硬性要求(其误报率为1.6%)。 **3. 在签约前必须澄清的未知项** - **漏报率达标确认**:Alpha漏报率(1.1%)略高于需求(0.8%),需书面确认此指标是否可接受或是否有明确改进计划。 - **边缘推理风险**:其边缘推理功能“尚未量产”,需明确量产时间表、性能指标及对现有方案的影响。 - **接口文档**:评估其接口文档的成熟度,以确认是否满足集成需求。
本次回答
**推荐供应商:Alpha** **1. 推荐理由** Alpha方案满足所有硬性要求:吞吐量(20,000 > 18,000)、误报率(1.2% < 1.5%)、漏报率(1.1% > 0.8%,但仍在可接受范围,见澄清项)、支持私有化部署、数据可境内落地、上线周期(75天 < 90天)。其两年总成本(180+120+90=390万元)低于预算上限(480万元),且实施周期较短。 **2. 不推荐另外两家的关键原因** - **Beta**:不满足“必须支持私有化部署”的硬性要求(仅公有云托管),且数据境内存储未承诺(仅可申请)。 - **Gamma**:不满足“误报率不高于1.5%”的硬性要求(其误报率为1.6%)。 **3. 在签约前必须澄清的未知项** - **漏报率达标确认**:Alpha漏报率(1.1%)略高于硬性要求(0.8%),需书面确认此指标是否可接受或承诺优化至0.8%以下。 - **边缘推理风险**:其边缘推理功能尚未量产,需明确量产时间表、性能指标及此部分是否影响项目验收。 - **接口文档**:需评估其接口文档的成熟度是否满足集成需求,并明确“共同打磨”的具体责任与时间。

得分 Top 5

Debug:DFS 环检测 代码执行 (v5)
10 100 +90
diff_patch_unit_test STRICT
展开查看详细证据
上次回答
```python def has_cycle(graph): visited = set() rec_stack = set() def dfs(node): if node in rec_stack: return True if node in visited: return False visited.add(node) rec_stack.add(node) for nei in graph.get(node, []): if dfs(nei): return True rec_stack.remove(node) return False for n in graph: if dfs(n): return True return False ```
本次回答
```python def has_cycle(graph): visited = set() rec_stack = set() def dfs(node): if node in rec_stack: return True if node in visited: return False rec_stack.add(node) visited.add(node) for nei in graph.get(node, []): if dfs(nei): return True rec_stack.remove(node) return False for n in graph: if n not in visited: if dfs(n): return True return False ```
异常处理链 代码执行 (v5)
10 95 +85
python_unit_test STRICT
展开查看详细证据
上次回答
```python import json import logging def load_and_apply(path): try: try: text = read_config(path) except FileNotFoundError: logging.error("配置文件未找到") return False try: config = parse_config(text) except json.JSONDecodeError: logging.error("配置文件解析错误") return False try: apply_config(config) except ValueError: logging.error("配置应用错误") return False return True finally: print("配置加载流程结束") ```
本次回答
```python import json import logging def load_and_apply(path): try: try: text = read_config(path) except FileNotFoundError: logging.error("配置文件未找到") return False try: config = parse_config(text) except json.JSONDecodeError: logging.error("配置文件解析失败") return False try: apply_config(config) except ValueError: logging.error("配置应用失败") return False return True finally: print("配置加载流程结束") ```
Debug:链表反转 代码执行 (v5)
10 95 +85
diff_patch_unit_test STRICT
展开查看详细证据
上次回答
```python class ListNode: def __init__(self, val=0, next=None): self.val = val self.next = next def reverse_list(head): prev = None curr = head while curr: next_temp = curr.next # 保存下一个节点 curr.next = prev # 反转当前节点的指针 prev = curr # 移动prev到当前节点 curr = next_temp # 移动curr到下一个节点 return prev ``` 原因:原代码在修改`curr.next`后立即使用`curr = curr.next`,此时`curr.next`已指向`prev`,导致丢失原链表后续节点。修正后先保存`next_temp = curr.next`,再修改指针,最后移动`curr`到保存的节点。
本次回答
```python class ListNode: def __init__(self, val=0, next=None): self.val = val self.next = next def reverse_list(head): prev = None curr = head while curr: next_temp = curr.next # 保存下一个节点 curr.next = prev # 反转当前节点的指针 prev = curr # 移动prev到当前节点 curr = next_temp # 移动到下一个节点 return prev ``` 原因:原代码在修改`curr.next`后立即使用`curr = curr.next`,此时`curr.next`已指向`prev`,导致丢失原始链表的下一个节点。必须先保存`curr.next`到临时变量,再更新指针。
数据流中位数 代码执行 (v5)
10 95 +85
python_unit_test STRICT
展开查看详细证据
上次回答
```python import heapq class MedianFinder: def __init__(self): self.small = [] # 最大堆(用负数存储实现) self.large = [] # 最小堆 def add_num(self, num: int) -> None: if len(self.small) == len(self.large): heapq.heappush(self.large, -heapq.heappushpop(self.small, -num)) else: heapq.heappush(self.small, -heapq.heappushpop(self.large, num)) def find_median(self) -> float: if len(self.small) == len(self.large): return (-self.small[0] + self.large[0]) / 2.0 else: return float(self.large[0]) ```
本次回答
```python import heapq class MedianFinder: def __init__(self): self.small = [] # 最大堆(用负数实现) self.large = [] # 最小堆 def add_num(self, num: int) -> None: if not self.small or num <= -self.small[0]: heapq.heappush(self.small, -num) else: heapq.heappush(self.large, num) # 平衡两个堆 if len(self.small) > len(self.large) + 1: heapq.heappush(self.large, -heapq.heappop(self.small)) elif len(self.large) > len(self.small): heapq.heappush(self.small, -heapq.heappop(self.large)) def find_median(self) -> float: if len(self.small) > len(self.large): return -self.small[0] return (-self.small[0] + self.large[0]) / 2.0 ```
位运算:判断2的幂与 bit count 代码执行 (v5)
20 100 +80
python_unit_test STRICT
展开查看详细证据
上次回答
```python def is_power_of_2(n): return n > 0 and (n & (n - 1)) == 0 def count_bits(n): count = 0 while n: n &= n - 1 count += 1 return count print(is_power_of_2(0)) print(is_power_of_2(8)) print(is_power_of_2(12)) print(count_bits(15)) ``` ``` False True False 4 ```
本次回答
```python def is_power_of_2(n): return n > 0 and (n & (n - 1)) == 0 def count_bits(n): count = 0 while n: count += n & 1 n >>= 1 return count print(is_power_of_2(0)) print(is_power_of_2(8)) print(is_power_of_2(12)) print(count_bits(15)) ``` ``` False True False 4 ```
返回升降榜