最近、動画生成分野で混乱が生じています。ウィル・スミスが自身のラーメンを食べる動画の信憑性を釈明し、注目を集めています。同時に、AIモデルSoraの発表により、その精巧さが人々の認識に挑戦し、真偽の判断が困難になっています。
Soraの発表はソーシャルメディアで大きな話題を呼びましたが、そのリアルさゆえに動画の信憑性、情報源の特定が難しくなっています。ウィル・スミスの動画とSoraで生成された動画の違いは、人々に深い考えを与え、AI技術の発展に伴うフェイクニュースへの懸念を高めています。
最近、動画生成分野で混乱が生じています。ウィル・スミスが自身のラーメンを食べる動画の信憑性を釈明し、注目を集めています。同時に、AIモデルSoraの発表により、その精巧さが人々の認識に挑戦し、真偽の判断が困難になっています。
Soraの発表はソーシャルメディアで大きな話題を呼びましたが、そのリアルさゆえに動画の信憑性、情報源の特定が難しくなっています。ウィル・スミスの動画とSoraで生成された動画の違いは、人々に深い考えを与え、AI技術の発展に伴うフェイクニュースへの懸念を高めています。
先日、魔楽コミュニティ(Modelers)で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。
2025年3月9日、カリフォルニア州——オープンソースモデルによって、テキストから動画を生成する技術がますます魅力的になっています。AI開発者Ostris(@ostrisai)は最近、Xプラットフォームで、自身の20枚ほどの画像を用いてトレーニングしたWan 2.1 LoRAモデルの成果を共有しました。家庭用のRTX4090グラフィックカードを使用するだけで、驚くほど高品質な動画生成を実現しています。この成果はオープンソース技術の可能性を示すだけでなく、Xコミュニティで動画LoRAトレーニングに関する議論を活発化させています。
A Tencent anunciou o lançamento de código aberto de sua nova estrutura de geração de vídeo a partir de imagem — HunyuanVideo-I2V. O lançamento deste modelo representa mais um avanço importante após o sucesso do lançamento de código aberto do HunyuanVideo, e visa impulsionar a exploração aprofundada da comunidade de código aberto. O HunyuanVideo-I2V incorpora tecnologias avançadas de geração de vídeo, permitindo a transformação de imagens estáticas em conteúdo de vídeo dinâmico, oferecendo mais possibilidades aos criadores. O HunyuanVideo-I2V utiliza um pré-treinamento...