Modèle TANGO

Technique de reconstitution vidéo de gestes concomitants à la parole

Produit OrdinaireVidéoIntelligence artificielleReconnaissance gestuelle

TANGO est une technique de reconstitution vidéo de gestes concomitants à la parole, basée sur l'intégration hiérarchisée audio-motrice et l'interpolation par diffusion. Elle utilise des algorithmes d'intelligence artificielle avancés pour convertir les signaux vocaux en mouvements gestuels correspondants, permettant une reconstitution naturelle des gestes des personnages dans une vidéo. Cette technologie présente un large éventail d'applications dans la production vidéo, la réalité virtuelle et la réalité augmentée, améliorant l'interactivité et le réalisme du contenu vidéo. Développé conjointement par l'Université de Tokyo et le CyberAgent AI Lab, TANGO représente le niveau actuel de pointe de l'intelligence artificielle dans les domaines de la reconnaissance gestuelle et de la génération de mouvements.

Ouvrir le site Web

Modèle TANGO Dernière situation du trafic

Nombre total de visites mensuelles

2162

Taux de rebond

50.90%

Nombre moyen de pages par visite

1.1

Durée moyenne de la visite

00:00:00

Modèle TANGO Tendance des visites

Modèle TANGO Distribution géographique des visites

Modèle TANGO Sources de trafic

Modèle TANGO Alternatives

Modèle TANGO — Technique de reconstitution vidéo de gestes concomitants à la parole

Vidéo

•Intelligence artificielle•Reconnaissance gestuelle

636

Modèle SCENIC — Modèle de contrôle par instruction et de navigation sémantique perceptive des scènes

Programmation

•Intelligence artificielle•Traitement du langage naturel

138

ControlMM — Framework de génération de mouvements corporels complets, prenant en charge le contrôle multi-modal

Autre

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

Modèle TANGO

Modèle TANGO Dernière situation du trafic

Modèle TANGO Tendance des visites

Modèle TANGO Distribution géographique des visites

Modèle TANGO Sources de trafic

Modèle TANGO Alternatives

Modèle TANGO — Technique de reconstitution vidéo de gestes concomitants à la parole

Modèle SCENIC — Modèle de contrôle par instruction et de navigation sémantique perceptive des scènes

ControlMM — Framework de génération de mouvements corporels complets, prenant en charge le contrôle multi-modal

Lyria2 — Lyria 2 est un modèle de génération musicale haute fidélité.

Flex.2-preview — Modèle de diffusion texte-image à code source ouvert avec 8 milliards de paramètres.

Marché A2A — Première plateforme mondiale d'enregistrement d'agents A2A, unissant nos efforts pour créer un réseau de collaboration d'agents.

ChatTS-14B — Modèle améliorant la compréhension et le raisonnement des séries temporelles grâce à des données synthétiques.

InstantCharacter — InstantCharacter est un framework de personnalisation de personnage basé sur un transformateur de diffusion.

Wan2.1-FLF2V-14B — Modèle de génération vidéo open source, prenant en charge plusieurs tâches de génération.

Mailgo — Outil de marketing par e-mail froids à fort taux de délivrabilité, basé sur l'IA.

OpenAI Codex CLI — Agent de codage léger fonctionnant dans le terminal.

Liquid — Un modèle de génération multimodale intégrant la compréhension et la génération d'images.

HiDream — Plateforme de création AIGC entièrement en chinois, facile à utiliser, pour améliorer la créativité.

Assistant de carrière Boli — Solution de recherche d'emploi intelligente basée sur l'IA, pour améliorer le taux de réussite.

GLM-4-32B — Modèle linguistique puissant, prenant en charge plusieurs tâches de traitement du langage naturel.

GenPRM — Améliore le calcul du temps de test du modèle de récompense de processus grâce à l'inférence générative.

OpenAI Academy — Aider les éducateurs à utiliser efficacement l'intelligence artificielle grâce à des connaissances et des compétences.

Agno — Une bibliothèque légère pour construire des agents multimodaux.

AccVideo — Modèle de diffusion vidéo accéléré, vitesse de génération augmentée de 8,5 fois.

Fin-R1 — Grand modèle de raisonnement financier piloté par l'apprentissage par renforcement.

混元T1 — Premier modèle d'inférence Mamba hybride à très grande échelle du secteur, capacité de raisonnement forte.

Hun Yuan T1 — Modèle de raisonnement profond de pointe, optimisé pour les préférences humaines.

Reka Flash 3 — Modèle d'inférence généraliste de 21 milliards de paramètres, adapté aux applications à faible latence.

o1-pro — Le modèle o1-pro améliore ses capacités de raisonnement complexes grâce à l'apprentissage par renforcement, fournissant des réponses optimisées.

Orpheus TTS — Un système de texte à parole open source, visant à créer une voix humaine naturelle.

Mistral Small 3.1 — Modèle open source améliorant les capacités de traitement des tâches textuelles et visuelles.

Cohere Command — Cohere Command est un modèle linguistique hautes performances spécialement conçu pour les entreprises.

OpenJobs IA — Une plateforme intelligente pour aider les utilisateurs à trouver un emploi.

Cal AI APP — Suivez facilement vos calories en prenant des photos.

Light-R1 — Light-R1 est un projet open source axé sur l'inférence à longues chaînes (Long COT), qui fournit une méthode d'entraînement complète, de zéro, via SFT, DPO et RL.