シリコンバレーのテクノロジー大手による版図拡大に新たな章が加わりました!イーロン・マスク率いるxAI社が、動画生成AI技術に特化したスタートアップ企業Hotshot社の買収を発表しました。この戦略的な買収は、xAI社のマルチモーダルAI技術分野に新たな活力を注入することでしょう。

Hotshot社のCEOであるAakash Sastry氏はXプラットフォーム上でこのニュースを正式に発表しましたが、具体的な取引額は明かされていません。Redditの共同創設者Alexis Ohanian氏やSV Angelなど著名な投資家から支援を受けていた新鋭テクノロジー企業であるHotshot社(正式名称:Natural Synthetics Inc.)は、AI動画生成分野で独自の技術力を蓄積してきました。

合併 買収

2023年に設立されたHotshot社は、当初はAI画像生成・編集ツールに注力していましたが、2024年には動画生成分野に進出し、1280×720ピクセルの解像度で最長10秒の高品質動画を生成できるAIモデルを開発しました。同社は開発において、600万本の動画片段をトレーニングデータとして使用し、これらの動画に自動的にキャプションを生成する第2のニューラルネットワークを構築しました。この取り組みは、AIモデルの動画内容理解能力を大幅に向上させ、トレーニングプロセス全体を簡素化しました。

技術的な実現において、Hotshot社の動画生成器はbfloat16データ形式を採用しています。この形式は32ビット情報を16ビットに圧縮することで、AIモデルが計算処理で扱うデータ量を大幅に削減し、計算効率とトレーニング速度を向上させます。この動画生成器のトレーニングには4ヶ月かかり、数千個のNVIDIA A100グラフィックプロセッサが使用されました。これは、xAIのスーパーコンピューターColossusが搭載する20万個のNVIDIAチップのごく一部に過ぎません。買収発表のX投稿で、Sastry氏はHotshot社が動画生成器の開発を「継続的に拡大」し、Colossusの強力な計算能力を最大限に活用すると述べています。

xAIの人工知能モデルの中核となるインフラを支えるColossusスーパーコンピューターは、75万平方フィートのメンフィスの施設に設置されています。この施設は以前は家電工場でした。Colossusの最初のバージョンは昨年9月に稼働開始し、10万枚のグラフィックカードを搭載していました。3ヶ月後には、20万個のチップに加え、1EB(1エクサバイト)を超えるストレージ容量を搭載したアップグレード版のColossusが稼働を開始しました。

今年初めに、xAIはインフラのアップグレードを支援するため、メンフィスで2番目の施設を買収しました。同社は年末までにColossusのグラフィックカード数を100万枚に増やす計画です。この拡大計画の一環として、xAIはデルテクノロジーズと50億ドルを超えるAIサーバー購入について交渉しているという報道もあります。

xAIが動画生成分野に進出したことは、驚くべきことではありません。今年1月、イーロン・マスク氏は数ヶ月以内に動画生成モデルを発表する計画だと報じられていました。同社は、このアルゴリズムをアプリケーションプログラミングインターフェース(API)を通じて提供し、主力の大規模言語モデルシリーズGrokと並行して運用する可能性が高いです。

今回の買収は、マスク氏のAI技術分野における更なる展開を示すだけでなく、AI動画生成技術が新たな技術革新と商業応用の爆発的拡大を迎えようとしていることを示唆しています。この強力な連携が今後どのような革新的な成果をもたらすのか、注目しましょう。