テンセント、130億パラメーターの混元ビデオ生成大規模モデルを全面公開

テンセントは、最新の動画生成大規模言語モデル「混元動画生成モデル」を正式に発表し、全面的にオープンソース化しました。これは、人工知能による動画制作分野における大きなブレークスルーです。このモデルは130億のパラメータを持ち、現在、最大のオープンソース動画生成モデルとして高く評価されています。

テンセントの混元動画生成モデルは、4つの主要な利点を示しています。まず、超写実的な質感で、高解像度でリアルな動画コンテンツを生成でき、広告やクリエイティブな動画などの商業用途に適しています。次に、高い意味論的遵守能力を持ち、ユーザーのニーズに基づいて主題の詳細や人物像を正確に描写できます。3つ目は、動きの滑らかさで、生成された動きのシーンは物理法則に従っており、変形の危険性が低くなっています。最後に、ネイティブなショット変換機能があり、複数の視点からの同一被写体のショット切り替えを自動的に生成し、映像の叙述力を大幅に向上させ、動画コンテンツをより生き生きと豊かにします。

特筆すべきは、混元動画モデルが最近の1000問のブラインドテストで1位を獲得し、動画生成分野における卓越した性能を十分に証明したことでしょう。

ユーザーはこの革新的な技術を様々な方法で体験・利用できます。個人ユーザーはテンセント元宝アプリのAIアプリケーション-AI動画欄で試用を申請でき、企業ユーザーはテンセントクラウドのサービスインターフェースを通じて接続できます。さらに、このモデルはHugging FaceとGitHubプラットフォームで公開されており、企業や個人開発者に対し、無料での利用とエコシステムプラグイン開発の機会を提供しています。

このオープンソース化は、AI動画生成の技術的ハードルを下げるだけでなく、開発者やクリエイターに前例のない革新的なプラットフォームを提供します。テンセントはこの取り組みを通じて、人工知能技術の民主化と広範な応用を推進しています。

クリエイティブな仕事をする人、開発者、企業にとって、このモデルは間違いなく注目すべき大きな技術的ブレークスルーであり、多くの分野でイノベーションの可能性を解き放つでしょう。

公式サイト:https://aivideo.hunyuan.tencent.com

コード:https://github.com/Tencent/HunyuanVideo

モデル:https://huggingface.co/tencent/HunyuanVideo

AIニュース

テンセント、130億パラメーターの混元ビデオ生成大規模モデルを全面公開

AIbase基地

関連AIニュースの推奨

IBMとHugging Faceがタッグを組んで大発表！オープンソースの文書解読ツールSmolDoclingで、複雑な文書をワンクリックで構造化データに変換！

テンセントクラウドインテリジェントデジタルヒューマン、DeepSeek大規模言語モデルを全面的に導入し、ユーザーエクスペリエンスを向上

DeepSeek-R1を凌駕！アリババの万象大規模モデルが世界オープンソースランキングで首位に

Hugging FaceがFastRTCを発表：リアルタイム音声ビデオアプリケーション開発が容易に