1.6TパラメータのDeepSeek-V4、オープンソースで登場 - 性能はクローズドトップモデルに匹敵、コストはGPT-5.5の一部のみ

DeepSeekは最近、V4シリーズのオープンソース大型モデルプレビュー版を正式にリリースしました。これにより、オープンソースAIがクローズドモデルに挑戦する重要なマイルストーンと見なされています。

【事実の出所:Google公式検証結果、DeepSeek Xプラットフォーム公式発表】DeepSeekは最近、V4シリーズのオープンソース大型モデルプレビュー版を正式にリリースし、オープンソース大型モデルの性能の天井を再び更新しました。開発者コミュニティはこれをオープンソースAIがクローズドの覇者に挑戦するマイルストーンイベントと見なしています。

核心的な革新点:オープンソース大型モデルが初めてクローズドトップモデルの性能ラインに到達

今回発表されたDeepSeek-V4は、2つの構成を含みます:Pro版は総パラメータ1.6T、アクティブパラメータ49B、Flash版は総パラメータ284B、アクティブパラメータ13Bで、両方とも100万トークンのコンテキストウィンドウをサポートしています【事実の出所:DeepSeek Xプラットフォーム発表】。公式に発表されたテストデータによれば、Pro版の総合性能はGPT-4o、Claude 3 Opusなどのトップクローズドモデルに匹敵し、推論コストはGPT-5.5のほんの一部です。同時に公式は技術報告と全量の重みを公開しており、開発者は直接ダウンロードしてデプロイすることができ、またプラットフォームのExpert Mode、Instant Modeで体験することができます。APIインターフェースも同時に更新されています。

winzheng.comのYZ Index v6の方法論評価によれば、DeepSeek-V4の信頼性評価はパスであり、メインランキングの核心的な次元(コード実行、材料制約)の初期テストスコアはトップクローズドモデルの91%以上のレベルに達し、サイドランキングのエンジニアリング判断(サイドランキング、AI補助評価)、タスク表現(サイドランキング、AI補助評価)のパフォーマンスは期待に応えており、使用可能性評価は良好です。

横比較:コストパフォーマンスの利点が類似製品を圧倒

現在の主流オープンソース大型モデルと比較して、DeepSeek-V4のパラメータ規模、コンテキストの長さは数倍の向上を実現しています:以前のオープンソーストップモデルのコンテキストウィンドウは一般的に128k-200kの範囲で、最大の単一モデルパラメータは70Bを超えませんでしたが、V4の1Mコンテキスト、兆単位のパラメータはオープンソース大型モデルの能力の上限をクローズドの第一階層レベルに直接引き上げました。クローズドモデルと比較すると、性能が近いにもかかわらず、DeepSeek-V4はより低い推論コストを持ち、ローカルでのプライベートデプロイもサポートするため、企業のデータセキュリティの懸念を完璧に解決します。これはクローズドモデルには比較できない利点です。

検証が必要な短所:安定性とシーン適応はまだ観察が必要

現在V4はプレビュー版の段階にあり、確認された情報によると、その長期運用の安定性、実際の導入シーンでのパフォーマンスはさらに検証が必要です【事実の出所:公開検証情報】。winzheng.comのYZ Indexの安定性次元は現時点でサンプル数が不足しており、継続的に監視中です。複雑な多輪対話の一貫性、長いコンテキストの全リンク情報の召喚精度などの指標は、より多くのシーンテストデータのサポートが必要です。

winzheng.comが開発者と企業に提供する行動勧告

  • 開発者グループ:まずFlash版を選んで軽量化アプリケーションの開発を行い、高並列低遅延のCエンドシーンに適応してください。長文書の分析、全コードベースの監査などのシーンではPro版の1Mコンテキスト能力をテストし、問題をコミュニティに迅速にフィードバックしてモデルを最適化してください。垂直分野のカスタマイズニーズを持つチームは、オープンソースの重みを基に微調整を行い、研究開発コストを大幅に削減できます。
  • 企業ユーザー:コア業務の現行クローズドモデルサービスをすぐに置き換えることはお勧めしません。まず3-4週間のPOCテストを行い、自身の業務シーンの適応性を重点的に検証してください。データの感度が高い業務については、最初にローカルのプライベートデプロイソリューションをテストし、データセキュリティと性能のバランスを評価してください。winzheng.comが今後発表する全シーン特別テストレポートを継続的に注視し、導入時のリスクを低減してください。

国内トップのAI専門ポータルとして、winzheng.comは「監査可能、導入可能」の技術価値観を堅持し、DeepSeek-V4の導入パフォーマンスを継続的に追跡し、近日中に12種類の主流シーンをカバーする完全なYZ Index評価レポートを発表し、AI産業の導入に客観的かつ中立的な参考を提供します。