中国産LLM「DeepSeek-R1」の何がそんなにヤバいのか?AGI(汎用人工知能)が"オープンソース"で公開される可能性

DeepSeek-R1という単語に聞き覚えのない方のために簡単に説明しておくと、これは、中国のAIスタートアップ企業「DeepSeek」が2025年1月に発表した高性能な推論特化型AIモデルです。

OpenAIのChatGPT-o1と同等以上の性能を誇りながら、API*価格は最大98%安く、MITライセンス*でオープンソース化されている点が特徴。

*API──ソフトウェレア同士が機能やデータを共有するための「接続口」
*MITライセンス──「コードを自由に使えるが、著作権表示だけ残せばOK」というめちゃくちゃゆるいオープンソース規約

数学的推論やコーディングタスクに強く、特にアメリカ数学オリンピック予選(AIME 2024)では79.8%の正答率を達成し、人間の上位96.3%を凌ぐCodeforcesランクを記録しています。

今回は、中国産LLM「DeepSeek-R1」の何がそんなにヤバいのか、そして、AGI(汎用人工知能)がオープンソースで公開される可能性とインパクトについて考えていきます。

Deepseek R1 をまだ使用したことがないなら、損しています。モデルが自分自身と議論し、アイデアをテストし、アプローチを改良するのを見ると、不気味なほど人間の認知に近いように感じられます。答えを出すだけでなく、声に出して考えているので、その効果は驚異的です。

初めて、私たちは別の形の知性と地球を共有しているような気がします。その思考プロセスが展開するのを見ると、私たちが ASI にどれほど近いかがわかります。ほとんどの人が認めるよりも近いのです。

私は興奮していると同時に、心から恐怖を感じています。

https://x.com/signulll/status/1882786965608894629

ChatGPTやGeminiとの具体的な違い

1. 技術設計の革新性

DeepSeek-R1は「大規模強化学習(RL)のみで、事前の教師あり微調整(SFT)を省略)」して開発されました。これによって、従来のモデルよりも効率的に「自己検証」「反射的思考」「長い推論チェーン」の能力を獲得しています。

対して、ChatGPT-o1やGemini 2.0は、教師あり学習と強化学習を組み合わせたプロセスを採用しています。

要するに、DeepSeek-R1の学習方法は「自転車に乗れるようになるために、いきなり路上で転びながら覚えた人」のようなもの。

  • 大規模強化学習(RL)のみ → 教科書や先生なしで、「失敗したら修正し、成功したら褒める」をひたすら繰り返す
  • 「自己検証」「反射的思考」 → 転んだ原因を自分で分析し、次の挑戦で瞬時にバランスを調整する能力

一方、ChatGPTやGeminiは、「まず自転車の教科書で理論を学び(教師あり学習)、その後で実際に乗って練習する(強化学習)」という方法。

  • 教科書の知識があるので安定しているが、「現場での応用力」を身につけるのに時間がかかる

つまり、DeepSeek-R1は「実戦で鍛えたアスリート」、他モデルは「理論から入った優等生」というイメージです。前者は複雑な問題(例:迷路脱出)で柔軟に試行錯誤でき、後者は基礎問題(例:計算ドリル)に強い傾向があります。

2. 推論プロセスの可視化

ユーザーへの回答生成前に「思考過程(Chain of Thought, CoT)」をステップごとに表示します。

たとえば、質問をサブトピックに分解し、多角的な検討を経て最終回答を構築する過程をリアルタイムで確認可能です。これに対して、ChatGPTやGeminiは推論の内部プロセスを簡略化して提示する傾向があります。

DeepSeek-R1(CoTあり)→ 先生が算数の問題を解く時に、ノートに式を全部書いて見せてくれるイメージ。

例:「リンゴが3個、ミカンが5個。合計いくつ?」→ ノートに書く思考

  • まず「3+5」と計算
  • 「8」という答えを導出
  • 「でもミカンは腐ってるかも?」と疑って再確認
  • 最終的に「8個でOK!」と結論

ChatGPTやGemini(CoTなし)→ 先生が突然「答えは8!」とだけ言うイメージ。

例:同じ質問でも、頭の中で計算して即答。「どうして8なの?」と聞かない限り、途中式は教えてくれない。

実際、ChatGPTやGeminiもCoT機能を部分的に実装していますが、DeepSeek-R1の「推論プロセスの可視化」は、「ユーザーがAIの思考をリアルタイムで監査可能」が設計のコアにあります。

つまり、「AIの判断根拠を人間が完全に理解できる世界」を目指すオープンソース哲学が背景にあるということですね。

3. コストパフォーマンス

API価格がChatGPT-o1の最大25分の1と圧倒的に安価です。たとえば、100万出力トークンのコストはo1が60ドルに対し、DeepSeek-R1は2.19ドル。この低価格は、モデル訓練効率の劇的な向上(他社比11分の1の学習時間)と、ハードウェア制約下での最適化技術によるものです。

4. オープンソース戦略

モデル全体がMITライセンスで公開され、商用利用や改変が自由です。さらに、LlamaやQwenベースの蒸留モデル(1.5B~70Bパラメータ)も提供され、小規模開発者でも高性能AIを低コストで利用できます。対照的に、ChatGPTやGeminiはクローズドモデルが主流です。

分かりやすく説明すると、MITライセンスのAIモデルは「無料のレシピ本」のようなものですね。あなたはこれを自由に、

  • コピーして友達に配ったり(商用利用)
  • 味を変えて「自家製カレー」として売ったり(改変)
  • 材料を半分に減らして簡単版を作ったり(蒸留モデル)

できる。ただ、「このレシピ本を使いました」と書くだけで。

一方、ChatGPTなどのクローズドモデルは「高級レストランの隠し味」のようなもので、味は最高なのですが、

  • レシピは非公開(中身が見えない)
  • 毎回高い料金を払う必要あり(API課金)
  • 「辛くして」と注文しても断られる(カスタマイズ不可)

といった特性傾向があります。

蒸留モデルの価値についても説明しておくと、「レシピ本の『簡単版』『節約版』『大量調理版』が付属」しているイメージです。

要するに、小規模な店でも、

  • 材料費1/10(低コスト)
  • 家庭用コンロで作れる(低スペックPC対応)
  • 「子供向けマイルドカレー」も自由に開発可能(カスタマイズ性)

ということです。「料理の自由と可能性をすべての人に」。DeepSeekのヤバさは、そういったオープンソース哲学にあるんですよね。

オープンソースAGI実現がもたらす影響

2025年1月24日、DeepSeekの研究者がXで「私が知っているのは、オープンソースAGIを誰にとっても現実のものにするために、私たちが前進し続けているということです。」と発言したことが話題になっています。

オープンソースAGIの実現を目指すと発言した背景には、以下のような変革的な影響が想定されます。

1. テック企業の競争構造の変化

アメリカ企業の優位性低下

オープンソースAGIが普及すれば、MicrosoftやGoogleのような大手が持つ「モデル独占」のビジネスモデルが崩壊します。たとえば、DeepSeek-R1の低価格APIは、すでにOpenAIなどの米国AI企業の収益基盤を脅かしています。

中国AIスタートアップ「DeepSeek」のせいでMetaがパニックモードらしい。中国産LLMが米国AI企業に激震を与えた背景とは

新興企業・研究機関の台頭

リソースの少ない開発者でもAGI技術を活用できるようになり、イノベーションの民主化が加速します。特にアフリカや東南アジアなどの「グローバルサウス」でAI応用が拡大する可能性があります。

また、LLM(大規模言語モデル)の開発に遅れを取っていた日本にとっても、これは希望になり得るでしょう。

2. 地政学的な技術競争の激化

米中のAI覇権争いが新段階に

中国企業が制裁下で効率的なAI開発手法を確立したことで、米国の輸出規制の実効性に疑問が生じています。DeepSeekのような企業の台頭は、米国主導の技術秩序を揺るがす要因となります。

実際、DeepSeek-V3/R-1の存在は、アホみたいに大きなデータセンターを持たずとも高性能なAIの開発ができるということを証明してしまったわけですからね。結果、65兆円規模のクソデカAIインフラ計画「スターゲイト」に対する疑念も植え付けてしまった──と。

SoftBankとOpenAIが主導するAIインフラ計画「スターゲイト」がトランプ大統領から発表。投資額は4年間で5000億ドル(日本円で約65兆円)

3. 社会への波及効果

雇用構造の変容

AGIが労働市場に参入すれば、IMFの予測通り、先進国で最大60%の職種が影響を受けます。特に単純作業やデータ分析業務はAIエージェントに置き換わる可能性が高いです。

こんなものがオープンソースになったら、もうね。正直、世界がどうなっちゃうのか分かんない。

倫理的課題の顕在化

オープンソースAGIの普及は、悪意ある利用(偽情報生成、自律兵器開発)のリスクを高めます。これに対処するため、国際的なガバナンス枠組みの構築が急務と言えるでしょう。

高度な推論と検索を同時にできるDeepSeek

ちなみに、DeepSeekはアプリ版でも高度な推論と検索機能を同時に使うことができます。これは、2025年1月25日時点では、ChatGPT、Geminiのどのモデルにもできないことです。

【風刺】DeepSeekに対する人々の不安

R1に対する人々の不安について

ボブ:「急成長(foom)の可能性なんて証拠ないだろ」

アリス:「実際に急激な能力の爆発ってよく起きてるよ!Minecraft、チェス、将棋——例えば囲碁AIはたった3日間で急成長したんだから」

「人間から教わらず、自分自身と対戦するだけで何百万ゲームも学習したの」

「たった3日で、人間が数千年かけて蓄積した囲碁の知識を獲得。人間をはるかに凌駕し、新しい戦略を発明したの。『不可能』と言ってた人たちは完全に間違ってたわ」

ボブ:「囲碁で超人になるのと、全ての分野で超人になるのは別だろ」

アリス:「そうだけど、他にも例はたくさん…」

「AlphaZeroが最強チェスAI(人間よりはるかに強い)を超えるのに4時間、将棋で2時間、Minecraftでも数週間で超人レベルに達したのよ」

ボブ:「それ全部ゲームの話でしょ?現実世界じゃない」

アリス:「現実世界のスキルでもAIは次々と人間を追い越してるわ。時には数時間~数日で学習する。人間を完全に置き去りにしつつあるの」

「数日~数週間で知能が爆発的に進化し、AIが世界を掌握する可能性は現実的よ。急成長が確実とは言えないけど可能性はある」

「巨大なトレーニング実行はロシアンルーレットみたいなもの。今すぐ一時停止すべきだわ」

(技術的な詳細はQT参照)