Soraモデルの登場は、テキストから動画を生成する分野に革命を起こしつつあります。黄礼強氏によると、Soraモデルは多方面からの探求と突破を経て、DiT技術フレームワークを採用し、拡散モデルの限界を突破しました。七火山は有名企業との連携を通じて、テキストから動画を生成するコンテンツのローカライズとグローバル展開を推進しており、超訊通信は七火山への戦略投資を通じて、AIモデルの応用を現実のものにしています。
Soraモデル:テキストから動画生成分野における革命的ブレークスルー

Soraモデルの登場は、テキストから動画を生成する分野に革命を起こしつつあります。黄礼強氏によると、Soraモデルは多方面からの探求と突破を経て、DiT技術フレームワークを採用し、拡散モデルの限界を突破しました。七火山は有名企業との連携を通じて、テキストから動画を生成するコンテンツのローカライズとグローバル展開を推進しており、超訊通信は七火山への戦略投資を通じて、AIモデルの応用を現実のものにしています。
2025年3月9日、カリフォルニア州——オープンソースモデルによって、テキストから動画を生成する技術がますます魅力的になっています。AI開発者Ostris(@ostrisai)は最近、Xプラットフォームで、自身の20枚ほどの画像を用いてトレーニングしたWan 2.1 LoRAモデルの成果を共有しました。家庭用のRTX4090グラフィックカードを使用するだけで、驚くほど高品質な動画生成を実現しています。この成果はオープンソース技術の可能性を示すだけでなく、Xコミュニティで動画LoRAトレーニングに関する議論を活発化させています。
先日、OpenAIはロンドンで開催されたC21Media カンファレンスで、同社の動画生成ツールSoraのアップデート版を間もなくリリースすると発表しました。OpenAIの代表チャド・ニールソン氏は、この新バージョンでは3種類の動画生成方法に対応すると述べており、具体的にはテキストから動画生成、テキストと画像から動画生成、そしてテキストと動画から動画生成が可能です。生成される動画の長さは最長1分間となります。Sora動画生成ツールのアップグレード版は、効率性と速度が向上しているとのことです。関連するAPIのリークについても報告されています。
動画編集プラットフォームInVideoは最近、AIを活用したテキストから動画を生成する機能を搭載したメジャーアップデート版v3.0を発表しました。ユーザーはテキストプロンプトを入力するだけで、実写、アニメーション、または二次元スタイルの動画コンテンツを作成でき、YouTube、Instagram Reels、LinkedInなどのさまざまなプラットフォームに合わせて調整できます。この新機能はサードパーティのAIモデルを基盤としていますが、ユーザーはテキストプロンプトを追加することで動画をリアルタイムに動的に調整できます。
OpenAIは、主要サプライヤーとしてTSMCの1.6nmチップ製造プロセスを選択しました。これは、AIハードウェア分野における大きな戦略的アップグレードを示しており、2026年の量産開始が見込まれ、技術性能が大幅に向上する見込みです。BroadcomおよびMarvellとの連携により、OpenAIは2024年または2025年にTSMCの3nmプロセスシリーズに基づいたAIアプリケーション専用のASICを開発する予定です。さらに、Appleは新しいiPhoneにOpenAIのAIソリューションを統合する計画があり、可能性として…