メインコンテンツへスキップ

Gemini 2.5 Pro

gemini
Run #87 · 公式 v7 · 判定 v6 · 題庫 v6

エンジニアリング判断リーダー,タスク表現トップクラス,高可用性

69.7
総合スコア
#5 / 11
現在の順位
04-27 04:18 SGT
最終評価
推薦 コア総合 84.32
正常 更新 04-04 03:30

コア次元 (v6) v6

コード実行 89.4 材料制約 78.1 エンジニアリング判断 47.2 タスク表現 40 誠信評価 80.8
PASS
誠信
誠信スコア 80.80
コード実行
89.4
材料制約
78.1
エンジニアリング判断
47.2
タスク表現
40
誠信評価
80.8
v5レガシー次元を表示

レガシー次元 (v5) legacy

コード実行 96.1 知識 53.8 長文 83.4 コスパ 39.3 安定性 37.7 可用性 100
コード実行
96.1
知識
53.8
長文
83.4
運用メトリクス
コスパ
39.3
安定性
37.7
可用性
100.0

最近の変化

communication_raw +10 Gemini 2.5 Pro:任务表达 +10

スコアトレンド

0 20 40 60 80 100 03-17 03-17 03-17 03-19 03-21 03-22 03-24 03-24 03-25 04-06 04-20 04-27 vv3 vv4 vv5 vv6

v6スコアは最新の評価実行から

モデル一覧に戻る