Os olhos dos desenvolvedores globais voltam-se novamente para a China! Na Global Developer Conference (GDC), um evento muito aguardado, a comunidade Alibaba Cloud ModelScope anunciou com destaque o lançamento de dois novos modelos multimodais de código aberto da Step-Star, incluindo o Step-Video-T2V, o maior modelo de geração de vídeo de código aberto do mundo em termos de parâmetros e o Step-Audio, o primeiro modelo de interação de voz de código aberto em nível de produto do setor. Essa notícia explodiu instantaneamente a comunidade global de código aberto de IA, demonstrando mais uma vez a forte capacidade de inovação da China na área de inteligência artificial.
Como a maior comunidade de modelos de IA da China, o lançamento desses dois importantes modelos pela comunidade Alibaba Cloud ModelScope é, sem dúvida, o resultado de código aberto mais notável no campo multimodal global recentemente. O Step-Video-T2V, com sua enorme escala de parâmetros, bateu o recorde de modelos de geração de vídeo de código aberto, indicando que a criação de conteúdo de vídeo de maior qualidade e mais refinado está prestes a se tornar realidade. Já o Step-Audio ultrapassou as limitações dos modelos de voz tradicionais, tornando-se o primeiro sistema de interação de voz de código aberto em nível de produto do setor, o que significa que tecnologias de interação de voz mais naturais e inteligentes serão aceleradas e aplicadas.

Observação da fonte: A imagem foi gerada por IA, fornecida pelo Midjourney.
De acordo com a apresentação oficial, até o momento, a comunidade Alibaba Cloud ModelScope já reúne mais de 40.000 modelos de código aberto, cobrindo amplamente áreas de ponta, incluindo modelos de linguagem grandes (LLM), sistemas de diálogo, tecnologia de voz, geração de imagens por texto, geração de vídeos por imagens, etc., consolidando sua posição como a maior comunidade de modelos de IA da China. A escolha de lançar esses dois modelos significativos na comunidade ModelScope não apenas confirma a força da plataforma, mas também demonstra a contribuição positiva da Step-Star para a construção do ecossistema de código aberto.
O lançamento de resultados tão importantes de código aberto em um palco como a GDC, que atrai a atenção de desenvolvedores globais, demonstra sem dúvida o desenvolvimento vigoroso da tecnologia de IA chinesa e sua postura de cooperação aberta. O código aberto desses dois modelos reduzirá significativamente a barreira de entrada para o uso da tecnologia de IA, acelerando a popularização e o desenvolvimento da inteligência artificial global.