Google AI動画生成モデルVeo 2の使用コスト公開:1分間の動画が30ドル

先日、魔楽コミュニティ(Modelers)で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。
企查查APPによると、ファーウェイ技術有限公司による「AIモデルの生成方法および装置」に関する特許が最近公開されました。企查查の特許要約によると、この特許は人工知能技術分野に関連し、AIモデル生成の効率向上とリソース消費の低減に一定の貢献を果たします。この方法は、第一プロセッサがAIモデルの複数の演算子のそれぞれの実行時間、各演算子実行過程における第二プロセッサの第二メモリのメモリ占有量、およびメモリオフロード時間を基に、操作指示情報を最適化変数とする目標関数を構築することを含みます。
最近のポッドキャストで、マイクロソフトCEOのサティア・ナデラ氏は、言語モデルの成熟に伴い、AIモデルが標準化、コモディティ化しつつあると述べました。この変化により、企業のAI開発戦略の中心が、単なるモデル開発からシステム統合と製品開発へとシフトしていると指摘。ナデラ氏は、モデルだけでは不十分であり、企業は完全なシステムアーキテクチャと成功する製品に注目する必要があると強調しました。「現在のAI業界は、波のような活動の真っ只中にある」と述べ、2022年11月以降の状況を説明しました。
2025年3月9日、カリフォルニア州——オープンソースモデルによって、テキストから動画を生成する技術がますます魅力的になっています。AI開発者Ostris(@ostrisai)は最近、Xプラットフォームで、自身の20枚ほどの画像を用いてトレーニングしたWan 2.1 LoRAモデルの成果を共有しました。家庭用のRTX4090グラフィックカードを使用するだけで、驚くほど高品質な動画生成を実現しています。この成果はオープンソース技術の可能性を示すだけでなく、Xコミュニティで動画LoRAトレーニングに関する議論を活発化させています。