Stable AIは、画像ベースの動画生成モデルSVDのAPIサービスを開発者向けプラットフォームを通じて提供開始すると発表しました。
LAION-5Bデータセットに関する論争はあるものの、SVDは動画生成の質において依然として優位性を保っています。
同社は、RunwayやPika Labsといった競合他社に対抗し、より多様な動画生成機能を提供するため、ユーザーインターフェースのローンチを計画しています。
Stable AIは、画像ベースの動画生成モデルSVDのAPIサービスを開発者向けプラットフォームを通じて提供開始すると発表しました。
LAION-5Bデータセットに関する論争はあるものの、SVDは動画生成の質において依然として優位性を保っています。
同社は、RunwayやPika Labsといった競合他社に対抗し、より多様な動画生成機能を提供するため、ユーザーインターフェースのローンチを計画しています。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
アリババグループの科学者チームが、幅広い動画生成と編集タスクを統一的に処理することを目的とした汎用AIモデル、VACEを発表しました。VACEの中核は、強化された拡散Transformerアーキテクチャであり、その革新的な点は「ビデオ条件ユニット(VCU)」という新しい入力形式です。VCUは、テキストプロンプト、参照画像や動画シーケンス、空間マスクなど、多様なモダリティの入力を統一的な表現に凝縮し、専用のメカニズムによって異なる入力間の調整を行い、競合を回避します。概念の分離により、きめ細やかな制御を実現します。
先日、DBC、CIW、CISが共同で発表した「2025年AI動画生成企業トップ20」ランキングが正式に発表されました。快手傘下の可灵AI、愛詩科技PixVerseAI、そして抖音の即夢AIがトップ3を占めました。その他、アリババ(通義万相、絵蛙AIビデオ)、テンセント(智影)、科大訊飛(訊飛絵鏡)、MiniMax(海螺AI)など、多くの企業がランクインしています。
現代のメディア環境において、人工知能(AI)はニュースの入手方法を密かに変えつつあります。従来、ニュースを読むことは一方通行の体験で、読者は情報を受け取るだけで議論に参加することはありませんでした。しかし、チャットボットの台頭により、ニュース消費は双方向的なインタラクションへと進化し、読者の役割は受動的な受信者から能動的な参加者へと変化しています。ますます多くの読者が、AIツールやチャットボットを利用してニュースを精査、要約、解釈し、時には伝統的なメディアを完全に迂回するようになっています。このような「対話型ニュース」は、読者が記事を閲覧する際に…
人工知能による動画生成技術は、コンテンツ制作の様相をかつてないスピードで変えつつあります。AIbaseがソーシャルメディアから入手した情報によると、Google Veo 2がGoogle AI Studioに正式に登場し、ユーザー向けに無料トライアルが開始されました。このニュースは、開発者やクリエイターから大きな注目を集めており、Veo 2の普及における重要な一歩となるだけでなく、AI動画生成のための低コストなテスト環境を提供することになります。以下は、AIbaseによるこの動向に関する詳細なレポートです。Veo 2の無料トライアルの仕組みについて解説します。
アリババ通義实验室は最近、OmniTalkerという新型のデジタルヒューマン動画生成大規模モデルを発表しました。この革新的なモデルの中核は、参照動画をアップロードすることで、動画内の人物の表情、音声、話し方を正確に模倣できる点にあります。従来のデジタルヒューマン制作プロセスと比べて、OmniTalkerは制作コストを大幅に削減し、同時に生成コンテンツのリアル感とインタラクティブ体験を向上させ、幅広い用途のニーズを満たします。OmniTalkerは非常に使いやすく、ユーザーは…