12月19日、Googleは動画生成モデルVideoPoetを発表しました。このモデルは最長10秒の動画を生成でき、動画の内容に合わせて自動的にBGMと効果音も生成します。VideoPoetは動画の最終フレームの次のフレームを繰り返し予測することで動画を延長し、ユーザーに動画が無限に延長するように感じさせます。他のモデルとは異なり、VideoPoetは拡散モデルではなく大規模言語モデルを使用しているため、テキストから動画への変換、動画修復、動画のスタイル変更など、複数の機能を1つのモデルに統合しており、より柔軟に使用できます。
関連AIニュースの推奨

AIデイリーニュース:OpenAIが来週GPT-4.1シリーズを発表か;Pikaに新しいAIビデオ機能Twists追加;商湯科技が日日新V6を発表
【AIデイリーニュース】へようこそ!ここでは、AIの世界を探求するための毎日のガイドとして、AI分野のホットなトピックを毎日お届けします。開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を支援します。最新のAI製品はこちらをご覧ください:https://top.aibase.com/1、報道によるとOpenAIは来週、GPT-4.1シリーズ(Mini版とNano版を含む)を発表する見込みです。OpenAIがGPT-4.1シリーズとo3シリーズを発表することは、同社が多様な分野での進歩を遂げていることを示しています。

報道によると、OpenAIは来週、GPT-4.1シリーズ(Mini版とNano版を含む)を発売
人工知能分野のリーダーであるOpenAIが、来週、新たな技術トレンドを巻き起こそうとしています!テクノロジーメディアThe Vergeの報道によると、OpenAIはGPT-4.1シリーズ、o3シリーズ、その他複数のAIモデルを含む大規模なアップデートを予定しています。この集中リリースは、OpenAIの革新を加速させる野心を示すだけでなく、業界にさらに強力なAIツールをもたらします。GPT-4.1シリーズ:マルチモーダル能力の全面的なアップグレード GPT-4.0の後継として、GPT-4.1シリーズは

グーグル、GeminiとVeo AIモデルを統合し、スマートアシスタントを進化させる計画
最近のポッドキャスト番組で、Google DeepMindのCEO、デミス・ハサビス(Demis Hassabis)氏は、Googleが最終的にGemini人工知能モデルとビデオ生成モデルVeoを統合し、Geminiの物理世界に対する理解を向上させる計画であると述べました。彼は、Geminiは最初からマルチモーダル設計されており、現実世界でユーザーを真に支援できる「汎用デジタルアシスタント」を実現することを目的としていると指摘しました。ハサビス氏は述べています...
Pika、超現実的な操作技術「Pika Twists」を発表:AIビデオ編集が新たな境地へ
AIビデオ生成プラットフォームのPikaは最近、画期的な新技術を発表しました。この技術により、ユーザーはビデオ内のあらゆるキャラクターやオブジェクトを、超現実的な方法で操作できるようになります。この画期的な機能の発表は、世界中のクリエイターから熱烈な反響を呼び起こしました。AIbaseの情報によると、Pikaのこの技術は、非常にリアルなビデオ編集効果を実現します。クリエイターコミュニティから公開されたデモ映像は驚くべきものであり、ビデオコンテンツ制作におけるAIの可能性を無限に示しています。超現実的な操作:ビデオ編集の新たな体験Pikaの新技術は、高度なA…

商湯科技、新たなマルチモーダル大規模言語モデルを発表 未来のインタラクション時代に向けた布石
4月10日に行われた商湯テクノロジー交流会において、商湯科技は最新のマルチモーダル融合大規模言語モデル「商湯日日新SenseNova V6」と「商湯大装置SenseCore2.0」システムを発表しました。この新型大規模言語モデルは、テキスト、画像、ビデオなど様々な情報形式を統合し、より自然で豊かなインタラクション体験を提供することを目指しています。今回発表されたSenseNova V6シリーズには4つのバージョンが含まれており、中でもSenseNova V6Proが注目を集めています。

AIアバター生成企業Synthesia、Shutterstockとビデオコンテンツライセンス契約を締結
英国のスタートアップ企業Synthesiaは、人工知能技術を用いてリアルなアバターを生成する企業です。最近、アメリカのストックビデオ企業Shutterstockとライセンス契約を締結し、Shutterstockの豊富なビデオライブラリを活用して、同社の技術のリアルさを向上させることを目指しています。契約金額は公表されていませんが、Synthesiaは、これにより最新のAIモデルが人間の表情、声の調子、ボディランゲージをより正確に捉えるのに役立つと述べています。Synthesiaはデジタル…

商湯科技日日新V6震撼発表:マルチモーダルAIがさらに進化、APIは明日公開!
先日、商湯科技の創業者である徐立氏が、最新世代の人工知能大規模モデル「日日新V6」を発表しました。このニュースは瞬く間にテクノロジー業界で大きな話題となりました。AIbaseの情報によると、日日新V6はマルチモーダル能力において大きな飛躍を遂げ、商湯科技のAI分野におけるリーダーシップをさらに強固なものにしました。さらに素晴らしいことに、このモデルのAPIは明日正式に公開され、開発者により強力な技術サポートを提供し、AIアプリケーションの迅速な導入を支援します。マルチモーダル能力が全面的にアップグレードされた日日新V6は、商湯科技のSens...
OmniSVG登場:復旦大学と階躍星辰が共同開発したマルチモーダルベクトル画像生成の新基準
先日、復旦大学と中国のAIイノベーション企業である階躍星辰は、OmniSVGというエンドツーエンドのマルチモーダルSVG生成モデルを近日中に発表すると発表し、テクノロジーとデザイン業界で大きな注目を集めています。AIbaseが知る限り、OmniSVGは強力な生成能力をコアとして、シンプルなアイコンから複雑なアニメキャラクターまで、ベクトル画像の生成をサポートし、デジタルアート制作に全く新しいインテリジェントなソリューションを提供します。このモデルの登場は、ベクトル画像生成技術の限界を再定義する可能性があります。マルチモーダル生成:柔軟な対応

Google AI Studioの大幅アップデート:最新のGemini-2.0-flash-live-001が正式リリース

AIデイリーニュース:アリババとテンセントがMCPプロトコルを全面的にサポート;階躍星辰のマルチモーダル推論モデルStep-R1-V-Mini;美図のWHEE画像生成モデルMiracle F1
【AIデイリーニュース】へようこそ!ここでは、人工知能の世界を探求するための毎日のガイドとして、AI分野のホットな話題を毎日お届けし、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用に関する情報を提供します。最新のAI製品はこちらをご覧ください:https://top.aibase.com/1、アリババはMCPプロトコルを全面的にサポートすると発表し、テンセントもそれに続きました。最近、中国の人工知能分野では、ModelContextProtocolが国内AIの技術標準の変革をもたらしています。