声网CEO趙斌：大規模モデルAPIコスト、9割超削減　リアルタイム接続の新時代到来

先日開催されたRTE2024リアルタイムインターネット会議において、業界の専門家たちがAI産業の発展動向について深く分析しました。OpenAIによるAPI呼び出しコストの大幅な削減、そして中国市場における価格競争の激化に伴い、生成AIはかつてないスピードで産業変革を推進しています。

声網の創業者兼CEOである趙斌氏は、今後10～20年の技術開発は、端末側の大規模言語モデル（LLM）の応用能力向上を主要な方向とするだろうと指摘しました。この変革は、端末機器、ソフトウェア開発、クラウドサービス、そして人間と機械のインタラクションという4つの分野で全面的に展開されます。

端末機器はAI PCとAI Phoneへと進化します。

ソフトウェア開発は「AI搭載ソフトウェア」から「AIネイティブソフトウェア」へと移行します。

クラウドサービスはモデルの訓練と推論を全面的にサポートします。

人間と機械のインタラクションは自然言語対話を中心とします。

マッキンゼーの最新レポートによると、世界の生成AI市場規模は、2023年の670億ドルから2032年には1.3兆ドルへと急成長し、年平均成長率は42％に達すると予測されています。こうした背景の下、声網は積極的に事業を展開しており、大規模言語モデルのユニコーン企業であるMiniMaxと協力して、中国初のRealtime APIを開発すると発表しました。

メタバース、SF、サイバーパンク、大規模言語モデル(2)の絵画

画像出典：AI生成画像、画像ライセンス提供元Midjourney

技術コスト削減についても朗報が届いています。Lepton AIの創業者である賈揚清氏は、AI推論コストは1年以内に現在の10分の1にまで削減される見込みだと予測しています。同時に、モデル圧縮技術の進歩により、小型モデルの性能は大型モデルに近づいており、「オープンソース＋微調整」のアプローチが企業向けアプリケーションの主流となるでしょう。

しかし、業界の専門家たちは、AIの発展に伴う潜在的なリスクにも注意を促しています。Hugging Faceのエンジニアである王鉄震氏は、AIが人間に取って代わるという懸念はまだ時期尚早であるものの、動画の偽造が社会や青年の心理に与える悪影響など、既にいくつかの分野で負の影響が現れており、これらの課題が新たなイノベーションと起業の機会を生み出しているとも指摘しています。

MiniMaxのパートナーである魏偉氏は、多様なモダリティを持つAIがクリエイティブ産業における応用において大きな可能性を秘めていると楽観視しています。彼は、多様なモダリティ技術の成熟に伴い、AIがテキスト、音声、音楽、動画などの分野でクリエイターの効率向上をもたらし、関連産業のアップグレードを推進すると考えています。