¡La atención de los desarrolladores globales vuelve a centrarse en China! En la muy esperada Conferencia Mundial de Desarrolladores (GDC), la comunidad de Alibaba Cloud ModelScope anunció el lanzamiento de dos nuevos modelos multimodales de código abierto de Step-Star, incluyendo Step-Video-T2V, el modelo de generación de video de código abierto con mayor cantidad de parámetros del mundo, y Step-Audio, el primer modelo de interacción de voz de código abierto a nivel de producto de la industria. Esta noticia ha revolucionado la comunidad global de código abierto de IA, demostrando una vez más la sólida capacidad de innovación de China en el campo de la inteligencia artificial.

Como la comunidad de modelos de IA más grande de China, el lanzamiento de estos dos importantes modelos por parte de la comunidad de Alibaba Cloud ModelScope es, sin duda, el resultado de código abierto más destacado en el campo multimodal a nivel mundial recientemente. Step-Video-T2V, con su enorme escala de parámetros, ha batido el récord de los modelos de generación de video de código abierto, lo que presagia la llegada de la creación de contenido de video de mayor calidad y más sofisticado. Step-Audio, por su parte, ha superado las limitaciones de los modelos de voz tradicionales, convirtiéndose en el primer sistema de interacción de voz de código abierto a nivel de producto de la industria, lo que significa que las tecnologías de interacción de voz más naturales e inteligentes se acelerarán y se aplicarán de manera más amplia.

Audio, onda sonora, voz inteligente

Nota de la fuente de la imagen: Imagen generada por IA, proveedora de servicios de licencias de imágenes Midjourney

Según la información oficial, hasta la fecha, la comunidad de Alibaba Cloud ModelScope ha reunido más de 40.000 modelos de código abierto, cubriendo completamente los campos de vanguardia, incluyendo modelos de lenguaje grandes (LLM), sistemas de conversación, tecnología de voz, generación de imágenes a partir de texto, generación de video a partir de imágenes, etc., consolidando su posición como la comunidad de modelos de IA más grande de China. La elección de lanzar estos dos modelos de gran envergadura en la comunidad ModelScope no solo es un reconocimiento a la capacidad de la plataforma, sino que también refleja la contribución positiva de Step-Star a la construcción del ecosistema de código abierto.

El lanzamiento de estos importantes resultados de código abierto en la GDC, un evento que atrae la atención de los desarrolladores de todo el mundo, demuestra sin duda el auge del desarrollo de la tecnología de IA china y su actitud de cooperación abierta. El código abierto de estos dos modelos reducirá en gran medida el umbral de uso de la tecnología de IA y acelerará la popularización y el desarrollo de la tecnología de inteligencia artificial en todo el mundo.