L'attention des développeurs du monde entier se tourne à nouveau vers la Chine ! Lors de la Conférence mondiale des développeurs (GDC), très attendue, la communauté ModelScope d'Alibaba Cloud a annoncé le lancement en avant-première de deux nouveaux modèles multimodaux open source de Step-Star, notamment : Step-Video-T2V, le modèle de génération de vidéo open source avec le plus grand nombre de paramètres au monde, et Step-Audio, le premier modèle d'interaction vocale open source de niveau production du secteur. Cette annonce a immédiatement fait sensation au sein de la communauté open source mondiale de l'IA, soulignant une fois de plus la forte capacité d'innovation de la Chine dans le domaine de l'intelligence artificielle.

En tant que plus grande communauté de modèles d'IA de Chine, les deux modèles phares lancés par la communauté ModelScope d'Alibaba Cloud constituent sans aucun doute les résultats open source les plus remarquables du domaine multi-modal ces derniers temps. Step-Video-T2V, grâce à son énorme quantité de paramètres, a battu tous les records des modèles de génération de vidéo open source, annonçant une ère de création de contenu vidéo de meilleure qualité et plus raffinée. Step-Audio, quant à lui, a surmonté les limites des modèles vocaux traditionnels pour devenir le premier système d'interaction vocale open source de niveau production du secteur, ce qui signifie que les technologies d'interaction vocale plus naturelles et plus intelligentes seront plus rapidement adoptées.

Audio, ondes sonores, voix intelligente

Source : Image générée par IA, fournisseur de services d'autorisation d'images : Midjourney

Selon les informations officielles, à ce jour, la communauté ModelScope d'Alibaba Cloud a rassemblé plus de 40 000 modèles open source, couvrant un large éventail de domaines de pointe, notamment les grands modèles linguistiques (LLM), les systèmes de dialogue, les technologies vocales, la génération d'images à partir de texte et la génération de vidéos à partir d'images, consolidant ainsi sa position de leader en Chine. Le choix de publier ces deux modèles importants sur la communauté ModelScope témoigne non seulement de la puissance de la plateforme, mais aussi de la contribution active de Step-Star à la construction d'un écosystème open source.

La publication de résultats open source aussi importants sur la scène mondiale de la GDC, un événement phare pour les développeurs, démontre sans équivoque le développement dynamique des technologies d'IA chinoises et son engagement envers la coopération ouverte. La publication open source de ces deux modèles réduira considérablement le seuil d'utilisation des technologies d'IA et accélérera la diffusion et le développement des technologies d'intelligence artificielle dans le monde entier.