DeepSeek R1

DeepSeek

Run #87 · 公式 v7 · 判定 v6 · 題庫 v6

タスク表現トップクラス，高可用性

70.0

総合スコア

#4 / 11

現在の順位

04-27 04:18 SGT

最終評価

中立コア総合 75.89

コア次元 (v6) v6

WARN

誠信

誠信スコア 54.20

コード実行

78.9

材料制約

72.2

エンジニアリング判断

38.7

タスク表現

40

誠信評価

54.2

v5レガシー次元を表示

レガシー次元 (v5) legacy

コード実行

84.2

知識

43.6

長文

76.4

運用メトリクス

コスパ

90.3

安定性

30.2

可用性

100.0

最近の変化

communication_raw +10 DeepSeek R1：任务表达 +10

スコアトレンド

v6スコアは最新の評価実行から

モデル一覧に戻る