DeepSeek協奏曲というDeepSeekに関する記事が非常に分かりやすかったのでメモ。
DeepSeekという中国製のモデルが世界を席巻している。
OpenAIが有償で提供するo1より高性能だとか、OpenAIの規約に違反した方法で学習されているとか、色々あるのだが、それを噂する人々が不正確な情報に基づいてピーチクパーチクやっているだけなので基本的にメディアにはほぼ出鱈目な情報しか出ていない。
以下、要約。
【DeepSeekモデルの特徴】
高性能中国製AI:
- 「DeepSeek-V3」はGPT-4並み
- 「DeepSeek-R1」はGPT-4o相当
- 技術仕様(重み付けデータ)は公開されているが、完全なオープンソースではない
画期的な省リソース技術:
- 1.58ビット量子化(Microsoft発の技術)により:
- 従来80GB GPU×16台 → 2台で動作可能に
- 計算処理が「小数点計算」→「整数計算」に簡素化
- ローカル環境でも動作可能(例:500万円級の自作PC)
【論争のポイント】
データ使用の疑い:
- 質問すると「開発者はOpenAI」と回答(ChatGPTと同様の反応)
- OpenAIの利用規約違反(他社AIの学習禁止)の可能性
- 中国企業が規約を無視する傾向は以前から指摘
蒸留技術の問題:
- 高価なAIを「コピー」可能(例:ChatGPTの出力データで再学習)
- 法律で規制困難(研究阻害の懸念)
- OpenAIが規約で禁止しても実効性に限界
【市場への影響】
OpenAPIの優位性低下:
- 中国製APIは従量課金・トークン制限緩い(最大400万トークン対応)
- ローカル運用可能でプライバシー面でも優位
- 量子化技術で専用AIチップ需要増(例:AX630Cチップ)
産業構造の変化:
- 学習より「推論」が重要に(事前学習済みモデルの活用)
- GPUから専用推論チップ(Groqなど)へ移行
- IoT機器への組み込みが加速(ボタン電池で動作可能に)
【重要な気づき】
- 高価なAI開発が一夜で陳腐化するリスク
- クローズド戦略(NTTなど)の合理性再評価
- 技術革新より「既存技術の活用」が進展
【未来予測】
- 深海/宇宙など通信不能環境でもAIが活躍
- ハードウェア革命で「真のIoT」実現
- 半導体バブル終焉の可能性
つまり、端的に言えば「中国企業が既存技術を巧妙に組み合わせ、規制の隙間を突いてAI業界の勢力図を塗り替えつつある」状況。技術倫理と産業競争力のバランスが今後の焦点となる。
— shi3z (@shi3z) January 30, 2025