米国にショックを与えた中国発の生成AI、「ディープシーク」(後)

記事を保存する

保存した記事はマイページからいつでも閲覧いただけます。

印刷
お問い合わせ

日韓ビジネスコンサルタント
劉明鎬 氏

世界を脅かせた理由は

人工知能 イメージ    生成AI業界でトップ企業の1社と言って間違いのない米OpenAI(オープンAI)のモデルに対し、性能面で遜色のないモデル「R1」を、設立2年足らずの中国のスタートアップ企業が完成させたことに世界が驚いている。

 現在、「ディープシーク」が市場で話題となっているが、何よりも「ディープシーク」の性能に比べて利用コストが安いことが注目されており、オープンAIのLLM「o1」と遜色のない性能にもかかわらず、無料で使える点がとくに話題になっている。一方、オープンAIのo1を使うためには「ChatGPT Plus」プランを利用し、月額20米ドルを支払う必要がある。それもあってアップルストアでの「ディープシーク」のダウンロード数はチャットGPTを追い抜き1位となっている。

 また、米国は少し前から、中国の台頭を警戒してAI開発に必要な半導体や関連技術の輸出制限を行っていた。そのため中国のAI開発者は事実上、欧米の大手AI企業が開発に使用しているような、高度なGPUや開発環境を十分に利用できていなかった。そのような状況にもかかわらず、「ディープシーク」は比較的性能の低いAI半導体で、低コストモデルの開発に成功したことになる。

 また、開発費も低く抑えられている。開発に数十億ドルが費やされてきたChatGPTなどと比較すると、驚くべき低コストだ。コストを抑えられたのは、「Mixture of Experts(専門家の混合)」と呼ばれる、複雑なタスクを処理する際、大規模なモデル全体ではなく、特定のサブモデル(エキスパート)のみを選択して作業することによって、効率性を高めたからだとされる。「ディープシーク」のパラメータ数は6,710億個であるが、作業時にはこのなかの340億個だけを選択して作業するようになっているので、メモリ使用量がはるかに少なく、作業スピードも速くなるといい、同等の水準のチャットGPTに比べ、メモリ使用量は90%減少するという。

 たとえば数学のテスト「AIME 2024」ではディープシーク-R1が79.8%を記録し、オープンAIの「OpenAI-o1-1217」の正答率79.2%を上回る正答率となった。その他にも、既存のAIにはなかった新しい手法を多数導入して性能向上を図っている。とくに、「知識蒸留(Knowledge Distillation)」という手法を用い、オープンAIのAPIから大量のデータを取得し、モデルの学習に利用したと思われている。一部の専門家はオープンAIの学習データを不正使用した可能性も排除できないとしている。

「ディープシーク」の教訓

 莫大なコストと設備を必要とするため、これまでAIビジネスは大手企業だけが参入していたことも事実であるが、ディープシークをベンチマーキングすれば、低コストでAI開発ができる可能性も出てきた。ディープシークはクラウドを使わずにダウンロードして使うので、インターネットがなくても、デバイスだけでAIの機能が使えるオンデバイス環境がもっと普及することになるだろう。

(了)

(前)

関連キーワード

関連記事