DALL·E3画像生成モデルに67種類の新しい画像スタイルが追加されました。ユーザーは縦横比、スタイル、アスペクト比を調整して、より詳細な制御が可能になります。このアップデートは現在グレーテスト段階にあり、まもなく全ユーザーに公開される予定です。
同時に、OpenAIのDALL·E3は画像メタデータに透かしを追加し、コンテンツの出典と信頼性の標準化をサポートします。
DALL·E3画像生成モデルに67種類の新しい画像スタイルが追加されました。ユーザーは縦横比、スタイル、アスペクト比を調整して、より詳細な制御が可能になります。このアップデートは現在グレーテスト段階にあり、まもなく全ユーザーに公開される予定です。
同時に、OpenAIのDALL·E3は画像メタデータに透かしを追加し、コンテンツの出典と信頼性の標準化をサポートします。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
近頃、『One-Minute Video Generation with Test-Time Training』(テスト時訓練による1分間の動画生成)という題名の新しい研究論文が発表され、人工知能による動画生成技術が新たな段階に突入したことを示しています。この研究では、事前学習済みのTransformerモデルに革新的なテスト時訓練(TTT)層を導入することで、『トムとジェリー』(Tom and Jerry)の1分間のアニメーションを生成することに成功しました。
腾讯ARCラボと香港城市大学は、近頃「AnimeGamer」という革新的な研究プロジェクトを発表しました。このユニークなツールは、無限のアニメ人生シミュレーションを実現し、次のゲームの状態を予測する強力な能力を備えています。つまり、ユーザーは前例のない方法で好きなアニメの世界に没頭し、オープンな自然言語コマンドを通じて、ゲーム内のダイナミックな環境とリアルタイムでインタラクトできます。アニメの主人公になりきり、無限のインタラクションを楽しみましょう。AnimeGamerの最も注目すべき特徴は…
先日、バイトダンス(ByteDance)は最新のAIプロジェクトであるDreamActor-M1を発表しました。これは動画生成技術に革新をもたらす最先端の成果です。このモデルは、静止画1枚と参考動作動画を組み合わせることで、写真中の人物を動画シーンにシームレスに置き換え、表情豊かで自然な動き、高画質の動画を生成できます。この技術の発表は、バイトダンスの生成AI分野における新たな飛躍を示すだけでなく、既存のアニメーション生成ツール(Runwayなど)への挑戦とも見なされています。
Metaとウォータールー大学の研究者らが最近、テキストによる簡単な説明から、同期した音声と自然な動きのある全身アニメーションキャラクターを生成できる、MoChaという新しいAIシステムを発表しました。この革新的な技術は、コンテンツ制作の効率と表現力を大幅に向上させ、多くの分野で大きな可能性を秘めています。従来の方法を打ち破り、全身アニメーションと正確な口パクを同期させる、これまでのAIモデルが主に顔の表情に焦点を当てていたのに対し、MoChaは全身の自然な動きをレンダリングできる点がユニークです。
最近、LHM(大規模アニメーション可能人体再構築モデル)と呼ばれる革新的な技術が3D人体再構築分野で大きな進歩を遂げ、この分野に新たな発展方向と応用展望をもたらしました。単一画像からのアニメーション可能な3D人体再構築は、幾何学的、外観的、変形的分離の曖昧性などの問題が存在するため、非常に困難な課題でした。現在の最新の研究は、主に静的な人体モデリングに集中しており、これらの手法は合成された3Dスキャンをトレーニングに依存することが多く、その応用範囲を大きく制限しています。
3月17日、北京生数科技有限公司は、同社のビデオ大規模言語モデル製品であるViduと、アメリカの有名なアニメ制作スタジオAura Productionsとの戦略的提携を発表し、初の海外AIオリジナルSFアニメシリーズを共同制作すると発表しました。この提携は、AI技術がアニメ制作ワークフローに本格的に導入され、AIビデオ生成プラットフォームがアニメ短編の創作に関与する業界の先駆けとなり、アニメ業界がAI駆動の新たな時代へと進むことを意味します。