En la selección anual de los "Diez Grandes Artefactos Nacionales" organizada por el Centro de Prensa de la Comisión Estatal de Administración y Supervisión de Activos Estatales del Consejo de Estado, el modelo de lenguaje grande Xingchen, desarrollado de forma autónoma por China Telecom, ha sido seleccionado con éxito gracias a sus innovadores logros tecnológicos. Como el primer sistema de modelos básicos de tamaño completo, multimodal y de producción nacional en China, el modelo Xingchen ha demostrado una excelente capacidad en los campos de la semántica, el audio, la visión y la multimodalidad.

En el campo de la semántica, el modelo Xingchen ha logrado un importante avance. Basado en un clúster de miles de tarjetas de producción nacional y un marco de entrenamiento, este modelo ha alcanzado más del 93% de la potencia de cálculo equivalente a la de Nvidia, y el tiempo de entrenamiento representa hasta el 98%. Cabe destacar que este modelo ocupa el primer lugar en la lista de evaluación internacional C-Eval y supera a varios modelos de lenguaje grandes conocidos en China en la lista OpenCompass.

image.png

En cuanto a la tecnología de voz, el modelo Xingchen muestra ventajas únicas. Como el primer modelo de lenguaje grande de voz en China con doble registro en la Administración del Ciberespacio de China, ha superado con éxito los desafíos tecnológicos del reconocimiento de voz mixta en múltiples dialectos, cubriendo 40 regiones dialectales. Su tecnología de generación de voz ultranatural solo necesita muestras de 5 a 10 segundos para lograr una similitud de timbre superior al 90%, alcanzando un nivel líder en la industria.

En el campo de la visión, el modelo Xingchen ha recibido la evaluación de académicos y expertos como "alcanzando un nivel internacional avanzado". Actualmente, este modelo se ha implementado en 765.000 cámaras en todo el país, con un volumen de llamadas diarias superior a los 600 millones, desempeñando un papel importante en la gobernanza urbana y la gestión del tráfico.

En cuanto a la capacidad multimodal, el modelo Xingchen también muestra un rendimiento destacado. Su capacidad de generación de imágenes ha superado a la de la plataforma internacional conocida Midjourney, y su tecnología de generación de vídeo ocupa el primer lugar en la lista VBench. En particular, en la generación de vídeos largos, ha logrado por primera vez la generación continua de vídeos de 5 minutos.

Actualmente, el modelo Xingchen se ha transformado en más de 10 productos de IA estandarizados, que se aplican en 50 escenarios de la industria, incluyendo el sector público y la industria. Como sistema de IA de producción nacional completamente autónomo y controlable, el éxito del modelo Xingchen no solo demuestra la capacidad tecnológica de China Telecom, sino que también marca un importante avance en los logros de China en la innovación tecnológica en el campo de la IA.