DeepSeek は本当にオープンソースですか?

CometAPI
AnnaJun 2, 2025
DeepSeek は本当にオープンソースですか?

1年初頭にR2025推論モデルで初めて注目を集めた中国のAIスタートアップ企業DeepSeekは、オープンソースAIの現状とその広範な影響について激しい議論を巻き起こしました。多くの注目は、OpenAIやAlibabaといった米国企業のモデルに匹敵する驚異的なパフォーマンスに集まっていますが、DeepSeekが精神と実践において真に「オープンソース」であるかどうかについては疑問が残ります。本記事では、DeepSeekを取り巻く最新の動向を掘り下げ、そのオープンソースとしての信頼性を探り、GPT-4.1などのモデルと比較し、世界のAI環境への影響を評価します。

DeepSeek とは何ですか? どのようにして誕生したのですか?

DeepSeekの起源と野望

DeepSeekは杭州DeepSeek人工知能基礎技術研究有限公司という名称で設立され、梁文鋒(梁文鋒とも呼ばれる)が主要なビジョナリーとしてその先頭に立っています。DeepSeekの理念は多くのシリコンバレーのスタートアップとは一線を画しており、迅速な商業化を優先するのではなく、研究の効率性と費用対効果を重視しています。2025年初頭には、DeepSeekのR1モデルは、ハイエンドAIチップに対する米国の輸出規制という制約下で開発されたにもかかわらず、数学的推論とコード生成において主要ベンチマークに匹敵、あるいは上回る性能を発揮し、既に注目を集めていました。

推論モデルのブレークスルー

2025年1月、DeepSeekはMITライセンス(オープンソースの許容ライセンス)の下でR1を発表し、R79.8が「AIME 1で2024% Pass@1を達成し、OpenAI-o1217-97.3をわずかに上回り」、MATH-500で1%のスコアを獲得し、o1と同等で、他の公開モデルを上回った」と主張しました。コーディングタスクでは、R2,029はCodeforcesで96.3 Eloレーティングを達成し、人間の参加者のXNUMX%を上回り、このモデルが単なる理論的な演習ではなく、現実世界のアプリケーションに適した高性能ツールであることを示しました。

DeepSeekは、専門家混合(MoE)レイヤーや、貿易制限によって必要となった低性能AIチップでの学習といった技術を活用することで、学習コストを劇的に削減しました。このアプローチは、最高級ハードウェアへの依存という従来の常識を覆すだけでなく、業界全体に「衝撃波」を巻き起こし、NVIDIAの時価総額を600回の取引で約XNUMX億ドル下落させたと、専門家は指摘しています。これは「米国株式市場史上、単一企業による最大の下落」です。

DeepSeek は本当にオープンソースですか?

ライセンスと可用性

DeepSeekのR1モデルは、2025年1月にHugging FaceでMITライセンスの下でリリースされ、モデルの重みと関連コードの無制限の商用利用、改変、再配布が許可されました。 このライセンスの選択により、技術的にはR1はオープンソースプロジェクトに分類されますが、実際には微妙な差異が生じます。 モデルの重みと推論コードは公開されていますが、完全なトレーニングデータセットや正確なトレーニングパイプラインはリリースされていません。 この省略により、エンドツーエンドの再現性の詳細を共有するプロジェクトと同じ精神で「完全に」オープンソースとして適格であるかどうかという疑問が生じます。 たとえば、誰でもR5,000をダウンロードして微調整できますが、独自のデータとクラスター構成(100個のAXNUMX GPUを使用したFire-Flyerクラスターなど)にアクセスせずにDeepSeekの元のトレーニング手順を再現することはできません。

トレーニングデータの透明性

オープンソースの純粋主義者は、モデルの重みやコードの可用性だけでなく、学習データ、前処理スクリプト、評価ベンチマークに関する透明性も重視する傾向があります。今回のケースでは、R1が生成した合成データを用いて抽出されたバリアントを微調整することや、R1-Zeroにルールベースの報酬関数を組み込むことなど、概要は公開していますが、データの出所やキュレーションプロセスに関する詳細は明らかにしていません。こうした情報がなければ、外部の研究者は潜在的なバイアス、データ汚染、意図しないプライバシー漏洩を完全に監査することができず、モデルの倫理的およびセキュリティ上の意味合いについて疑問が残ります。

コミュニティの参加とフォーク

DeepSeek-R1はオープンソースとしてリリースされて以来、Hugging Faceなどのプラットフォーム上でフォークやコミュニティ主導の実験が活発に行われてきました。開発者たちは、1.5億から70億のパラメータを持つより小規模な「蒸留」版を、コンシューマー向けGPUなどの汎用ハードウェアで動作するように適応させ、アクセスを拡大したと報告しています。しかし、膨大な計算リソースが必要となることや、公開されている生のデータセットが存在しないことが一因となり、R1をゼロから再現しようとする完全に独立した試みはまだ行われていません。コミュニティ公式の複数の再現活動を生み出したLLaMAとは対照的に、DeepSeekの「オープンソース」という主張は、コミュニティ主導の研究の完全な透明性を実現することではなく、重みを公開することに主眼を置いています。

DeepSeek と他の AI モデルを比較するとどうなりますか?

OpenAI o1、o3、GPT-4.1 に対するベンチマーク

DeepSeek-R1のパフォーマンス指標は、推論モデルの中でもトップクラスに位置しています。LiveCodeBench(カリフォルニア大学バークレー校、MIT、コーネル大学が開発)の内部ベンチマークによると、DeepSeekの最新版R1-0528は、コード生成においてOpenAIのo4-miniとo3にわずかに劣るものの、xAIのGrok 3-miniやAlibabaのQwen 3 miniを上回っています。一方、4.1年14月2025日にリリースされたOpenAIのGPT-4は、XNUMX万トークンのコンテキストウィンドウを誇り、前身のGPT-XNUMXoと比較して、コーディング、命令追跡、ロングコンテキストタスクにおいて優れた性能を発揮しています。

R1とGPT-4.1を比較すると、いくつかの要素が浮かび上がります。

  • コードと数学のベンチマークでのパフォーマンスR1はAIME 79.8で1% Pass@2024、MATH-97.3で500%のスコアを達成し、o1をわずかに上回りました。一方、GPT-4.1はコーディング(SWEベンチ検証済み)で推定約54.6%、ロングコンテキストタスクで72%を達成しています。これらの指標は印象的ではありますが、R1の特殊な推論ベンチマークと直接比較することはできません。
  • コンテキストウィンドウGPT-4.1は最大1万トークンをサポートし、書籍全体や長いコードベースをXNUMX回のパスで処理できます。DeepSeekのRXNUMXはこのコンテキスト長に対応しておらず、代わりに短い入力における推論と推論の効率性に重点を置いています。
  • コスト効率Hugging Faceでは、R1のAPIアクセスコストはOpenAIのo95よりも最大1%低く、予算が限られているスタートアップ企業や研究者にとって魅力的です。GPT-4.1の基本価格は、入力トークン2万個あたり8ドル、出力トークン0.40万個あたり1.60ドルで、ミニバージョンとナノバージョンはさらに低価格(それぞれ0.10ドル/0.40ドル、XNUMXドル/XNUMXドル)です。DeepSeekの蒸留モデルはラップトップでも実行できるため、ハードウェア要件の段階でさらに高いレベルのコスト削減を実現します。

アーキテクチャの違い

DeepSeekのR1モデルは、ネットワークの大部分が必要に応じてのみアクティブ化される専門家混合(MoE)アーキテクチャを採用しており、推論計算コストを大幅に削減します。これらのMoEレイヤーは、非同期通信ライブラリ(例: hfreduce) と Fire-Flyer DDP フレームワークにより、DeepSeek は、トレード制限の下で、より弱いハードウェア クラスター間で推論タスクを拡張できるようになります。

対照的に、GPT-4.1はネットワーク全体にわたって高密度のTransformerレイヤーを使用し、4.1万トークンのコンテキストウィンドウを処理します。これにより、ロングコンテキストタスクで優れたパフォーマンスが得られますが、学習と推論にかなりの計算リソースが必要になるため、GPT-4.1はGPT-XNUMX miniやnanoなどの小型モデルと比較して、価格が高額になっています。

DeepSeek のオープンソースアプローチの意味は何でしょうか?

世界のAI競争への影響

DeepSeekのオープンソース化は、シリコンバレーの伝統的な手法である、独自モデルとデータの禁輸措置を打ち破るものです。R1をMITライセンスの下で公開することで、DeepSeekは高性能AIは閉鎖的、あるいは独占的にライセンス供与されるべきだという考え方に異議を唱えました。その影響はすぐに顕著に現れました。米国のテクノロジー大手は価格調整を行い(例えば、OpenAIはGPT-4.1 miniとnanoを低価格で提供)、o4-miniのような独自の推論中心モデルの開発を加速させ、市場シェアを維持しました。業界評論家は、DeepSeekの登場を米国AIにとっての「スプートニクの瞬間」と呼び、AIの基盤的機能に対する覇権の転換を示唆しています。

DeepSeekのオープンソース戦略は、ベンチャーキャピタルのセンチメントにも影響を与えました。一部の投資家は、中国のオープンソース代替企業が急増した場合、米国のAI企業への投資は収益減少につながると懸念していましたが、一方で、世界的なAI研究協力の多様化の機会と捉える投資家もいました。ベンチャーキャピタリストのマーク・アンドリーセンは、R1を「最も驚くべき、そして印象的なブレークスルーの一つ」であり、「世界への大きな贈り物」と称賛しました。一方、OpenAIが4.1年2025月にリリースしたGPT-XNUMXは、DeepSeekの費用対効果の高いオープンソースモデルへの対抗策と捉えられ、オープンアクセスであっても最先端のパフォーマンスを犠牲にする必要がないことを示しています。

セキュリティとプライバシーの懸念

オープンソースAIの民主化への熱狂にもかかわらず、DeepSeekの起源はプライバシー擁護団体や政府機関の間で警戒感を招いている。2025年2025月、韓国の個人情報保護委員会(PIPC)は、同社のオンラインサービスが韓国のユーザーデータを中国のByteDanceサーバーに送信していることを確認した。これにより、コンプライアンス問題が解決されるまで新規アプリのダウンロードが禁止された。その後、XNUMX年XNUMX月下旬に発生したデータ侵害では、クラウドストレージデータベースの設定ミスにより、チャットメッセージ、APIキー、システムログなどXNUMX万件を超える機密情報が漏洩し、DeepSeekのデータセキュリティ対策に対する懸念が高まった。

中国の規制により、企業に国家当局へのデータ共有を義務付ける可能性があることから、一部の西側諸国の政府機関や企業は、DeepSeekを重要なワークフローに統合することに依然として慎重な姿勢を保っています。DeepSeekはインフラのセキュリティ確保に向けた措置(例えば、公開されたデータベースに1時間以内にパッチを適用するなど)を講じていますが、潜在的なバックドアや影響力行使のための悪用に対する懐疑的な見方は依然として根強く残っています。Wired誌は、DeepSeekのオンラインサービスがデータを母国に送信していることが「より厳しい監視のきっかけとなる可能性がある」と報じており、欧州と米国の規制当局は、GDPRとCCPAの枠組みに基づくより厳格な調査を示唆しています。

ハードウェアとインフラストラクチャのコストへの影響

DeepSeekは、最適化されていないハードウェア上で高性能な推論モデルを学習・展開できるという点で、AIインフラ市場全体に波及効果をもたらします。MoEレイヤーと最適化された並列処理(例: HaiScale DDP)が完全密度モデルと同等の推論精度を提供できることから、DeepSeekはMicrosoft Azure、AWS、Google Cloudといった主要クラウドプロバイダーにDeepSeekの最適化技術の統合を評価するよう促しました。MicrosoftとAmazonは、GPT-1やo4.1 APIの低コストな代替手段を求める顧客のニーズに応えるため、AIサービスカタログの一部としてDeepSeek-R1の提供を開始したと報じられています。

さらに、歴史的にGPUサプライヤーのリーダーであったNVIDIAは、MoE主導の効率性に対応し、競争力を維持するために、専用ハードウェア(HBM3対応GPUやNVLinkトポロジなど)に注力してきました。NVIDIAの株価上昇後の変動は、アルゴリズム効率の飛躍的向上がハードウェア需要予測をいかに大きく変える可能性があるかを如実に示しています。このように、DeepSeekは独自のハードウェアを発表することなく、将来のAIアクセラレータのロードマップに間接的に影響を与えてきました。

最新の R1-0528 アップデートは、DeepSeek のオープン性への取り組みについて何を明らかにしていますか?

R1-0528の技術的改良

28年2025月1日に発表されたDeepSeekのR0528-1アップデートは、数学的推論、プログラミングタスク、そして幻覚(AI生成情報におけるエラー)の軽減において大幅な改善を約束しています。DeepSeekはこのリリースを「マイナートライアルアップグレード」と表現していますが、カリフォルニア大学バークレー校、MIT、コーネル大学のLiveCodeBenchによるベンチマークテストでは、R0528-3がOpenAIのo4およびoXNUMX-miniモデルと競合するパフォーマンスを示しました。また、このアップデートでは、発表直後にHugging Faceで新しい重みと推論コードを公開することで、透明性のあるオープンソースポリシーを再確認し、コミュニティ主導の開発と共同最適化へのコミットメントを強化しています。

コミュニティの受容とフィードバック

開発者コミュニティはR1-0528に好意的に反応し、幻覚率の低下と出力の論理的一貫性の向上を挙げています。Hugging FaceやGitHubなどのフォーラムでの議論は、研究者がMITライセンスの寛容さを犠牲にすることなく、目に見えるパフォーマンス向上を高く評価していることを示唆しています。しかしながら、一部の貢献者は、学習データの不透明性や、微調整における政府の指示の影響の可能性について懸念を示しており、オープンソースライセンスだけでは完全な透明性が保証されないことを強調しています。これらの議論は、オープンソースの精神が監査可能で信頼できるAIシステムに確実に反映されるように、コミュニティの継続的な関与の必要性を浮き彫りにしています。

結論

DeepSeekのオープンソースAIへの進出は、アクセシビリティ、パフォーマンス、そしてコスト効率に対する期待を一新しました。R1モデルはMITライセンスに基づくオープンソースですが、完全な学習データとパイプラインの透明性が欠如しているため、「完全に」オープンであると分類するのは困難です。しかしながら、ハードウェアの制約下で強力な推論モデルを学習し、広く利用できるようにしたというDeepSeekの成果は、世界中のAIコミュニティに興奮と慎重な検証の両方をもたらしました。

OpenAIのGPT-4.1との比較は、微妙な違いを浮き彫りにしています。DeepSeekはターゲット推論タスクとコスト重視の設定で優れた性能を発揮しますが、GPT-4.1は広大なコンテキストウィンドウと広範なベンチマークにおける優位性により、ハイエンドのエンタープライズアプリケーションに最適な選択肢となっています。DeepSeekがR2モデルを開発し、クラウドプロバイダーとの連携を拡大するにつれ、その運命はデータプライバシーの懸念への対応、規制遵守の確保、そして研究プロセスのさらなる透明性の確保にかかっています。

結局のところ、DeepSeekの台頭は、オープンソースAIがもはや理論上の理想ではなく、競争を再構築する実践的な力であることを浮き彫りにしています。DeepSeekは、既存の既存企業に挑戦することでイノベーションのサイクルを加速させ、既存企業と新規参入企業の両方に、AIシステムの開発、ライセンス供与、導入方法の見直しを促しました。GPT-4.1が一つのベンチマークを設定し、DeepSeek-R1が新たなベンチマークを設定するこのダイナミックな環境において、オープンソースAIの未来はかつてないほど有望かつ波乱に満ちたものになりそうです。

スタートガイド

CometAPIは、数百ものAIモデルを単一のエンドポイントに集約する統合RESTインターフェースを提供します。APIキー管理、使用量制限、課金ダッシュボードといった機能が組み込まれています。複数のベンダーURLと認証情報を扱う代わりに、クライアントをベースURLに誘導し、各リクエストで対象モデルを指定するだけで済みます。

開発者はDeepSeek-V3(モデル名: deepseek-v3-250324)とDeepseek R1(モデル名: deepseek-r1-0528)を通じ コメットAPIまず、モデルの機能を調べてみましょう。 プレイグラウンド そして相談する APIガイド 詳細な手順についてはこちらをご覧ください。アクセスする前に、CometAPIにログインし、APIキーを取得していることを確認してください。

CometAPI は初めてですか? 1ドルの無料トライアルを始める 最も困難なタスクにソラを投入しましょう。

皆さんが作ったものを見るのが待ちきれません。何かおかしいと感じたら、フィードバックボタンを押してください。何が問題なのかを教えていただくことが、改善への一番の近道です。

もっと読む

1つのAPIで500以上のモデル

最大20%オフ