ByteDance lance OmniHuman : génération de vidéos dynamiques réalistes en corps entier à partir d'une seule photo

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Feb 5, 2025

1.8k

L'équipe de recherche de ByteDance a récemment développé un système d'intelligence artificielle appelé OmniHuman, capable de transformer une seule photo en une vidéo réaliste montrant une personne parlant, chantant et effectuant des mouvements naturels. Cette technologie révolutionnaire devrait bouleverser les secteurs du divertissement numérique et des communications.

OmniHuman peut générer des vidéos corporelles complètes, montrant les gestes et la dynamique des personnes lorsqu'elles parlent, surpassant ainsi les modèles d'IA précédents qui ne pouvaient animer que le visage ou le haut du corps. Au cœur de cette technologie se trouve la combinaison d'entrées multiples telles que le texte, l'audio et les mouvements corporels, via une méthode d'entraînement dite « conditionnelle complète », permettant à l'IA d'apprendre à partir d'un ensemble de données plus vaste et plus riche.

L'équipe de recherche souligne qu'OmniHuman, entraîné sur plus de 18 700 heures de données vidéo humaines, a montré des progrès significatifs. L'introduction de multiples signaux conditionnels (tels que le texte, l'audio et la posture) a non seulement amélioré la qualité de la génération vidéo, mais a également permis de réduire efficacement le gaspillage de données.

Dans un article publié sur arXiv, les chercheurs mentionnent que, malgré les progrès significatifs réalisés ces dernières années dans les techniques d'animation humaine de bout en bout, les méthodes existantes présentent encore des limites en termes d'évolutivité.

Le potentiel d'application d'OmniHuman est vaste, pouvant servir à la création de vidéos de présentation, de démonstrations d'instruments de musique, etc. Des tests ont montré que la technologie surpasse les systèmes existants sur plusieurs critères de qualité, démontrant ainsi ses performances exceptionnelles. Cette avancée intervient dans un contexte de concurrence croissante dans le domaine de la génération de vidéos par IA, où des entreprises comme Google, Meta et Microsoft sont également à la poursuite de technologies similaires.

Cependant, bien qu'OmniHuman offre des possibilités de transformation pour la production de divertissements, la création de contenu éducatif et les communications numériques, il soulève également des inquiétudes concernant l'utilisation potentielle abusive des médias synthétiques. L'équipe de recherche présentera ses résultats de recherche lors d'une prochaine conférence sur la vision par ordinateur, bien que la date et le lieu précis de la conférence n'aient pas encore été annoncés.

Article : https://arxiv.org/pdf/2502.01061

Points clés :
🌟 OmniHuman est un nouvel IA capable de transformer une seule photo en une vidéo réaliste du corps entier.
📊 Cette technologie a été entraînée sur 18 700 heures de données vidéo humaines et combine plusieurs signaux d'entrée pour améliorer la qualité de la génération.
⚖️ Malgré son vaste potentiel d'application, elle soulève des inquiétudes quant à la possibilité d'une mauvaise utilisation des médias synthétiques.

Nvidia et l'Utah lancent un programme d'éducation à l'intelligence artificielle pour former les talents de demain

Nvidia et le gouvernement de l'Utah ont récemment annoncé un partenariat stratégique pour lancer un programme complet d'éducation à l'intelligence artificielle, visant à améliorer les compétences de la main-d'œuvre de l'État et à stimuler la croissance économique. Ce partenariat public-privé fournira des ressources clés pour développer des compétences en intelligence artificielle générative aux universités, collèges communautaires et programmes d'éducation pour adultes de l'Utah. Au cœur du programme, les éducateurs pourront obtenir une certification professionnelle via le programme des ambassadeurs universitaires du Nvidia Deep Learning Institute, et bénéficieront de kits pédagogiques de haute qualité, de contenu pour des ateliers et d'un accès au cloud Nvidia GPU.

Microsoft investit 298 millions de dollars dans les infrastructures d'intelligence artificielle en Afrique du Sud

Le géant de la technologie Microsoft a récemment annoncé un investissement de 298 millions de dollars en Afrique du Sud pour la construction d'infrastructures d'intelligence artificielle et de centres de données. Cette initiative vise à stimuler le développement de l'économie numérique sud-africaine et à fournir aux entreprises et aux particuliers locaux un meilleur soutien et des services technologiques. Avec la demande mondiale croissante d'intelligence artificielle, l'investissement de Microsoft contribuera à renforcer la compétitivité de l'Afrique du Sud dans ce domaine. Le plan d'investissement de Microsoft comprend non seulement des investissements financiers, mais aussi l'introduction de technologies et le développement des talents. En collaborant avec les entreprises et les établissements d'enseignement locaux, Microsoft espère pouvoir, en Afrique du Sud,

Le département de la Justice américain exige que Google vende Chrome et assouplit les restrictions sur les investissements en IA

Selon de récents documents judiciaires du département de la Justice américain, Google reste tenu de vendre son navigateur web Chrome. Cette proposition, initialement formulée l'année dernière par le président Biden, a été maintenue par le département de la Justice sous la seconde présidence de Trump. Cependant, le département de la Justice n'exige plus que Google cède tous ses investissements en intelligence artificielle, y compris les milliards de dollars investis dans Anthropic. Dans ses documents judiciaires, le département de la Justice affirme que : « Les agissements illégaux de Google ont engendré un géant économique qui a gravement perturbé le marché, et il est essentiel de garantir que Google, quoi qu'il arrive, ne puisse plus exercer de pouvoir de marché aussi important. »

Actualités IA

ByteDance lance OmniHuman : génération de vidéos dynamiques réalistes en corps entier à partir d'une seule photo

AIbase基地

Recommandations d'actualités IA connexes

Nvidia et l'Utah lancent un programme d'éducation à l'intelligence artificielle pour former les talents de demain

Microsoft investit 298 millions de dollars dans les infrastructures d'intelligence artificielle en Afrique du Sud

FoxBrain : un modèle linguistique chinois de grande envergure lancé par Foxconn en seulement quatre semaines !

Le département de la Justice américain exige que Google vende Chrome et assouplit les restrictions sur les investissements en IA