fr
Top des produits IA
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
Accueil
Actualités IA
AI Quotidien
Guides de monétisation
Tutoriels IA
Navigation des outils IA
Bibliothèque de produits IA
fr
Top des produits IA
Recherchez la dynamique mondiale des produits IA
Recherchez des informations sur l'IA mondiale et découvrez de nouvelles opportunités d'IA
Actualités
Applications de produits
Études de monétisation
Tutoriels IA
Type :
Actualités
Applications de produits
Études de monétisation
Tutoriels IA
2024-07-26 09:26:21
.
AIbase
.
10.6k
VoxBlink2 : Un ensemble de données d'identification de locuteur audio-vidéo open source, fruit d'une collaboration entre l'Université de Wuhan et l'équipe d'intelligence artificielle Jiu Tian de China Mobile
L'Université de Wuhan, en collaboration avec l'équipe d'intelligence artificielle Jiu Tian de China Mobile et l'Université Duke Kunshan, a publié en open source VoxBlink2, un ensemble de données d'identification de locuteur audio-vidéo de plus de 110 000 heures basé sur des données YouTube. Cet ensemble de données comprend 9 904 382 segments audio de haute qualité et leurs segments vidéo correspondants, provenant de 111 284 utilisateurs YouTube. Il s'agit du plus grand ensemble de données d'identification de locuteur audio-vidéo publiquement disponible à ce jour. La publication de cet ensemble de données vise à enrichir les corpus de parole open source et à soutenir l'entraînement de grands modèles de reconnaissance vocale.