La Universidad de Ciencia y Tecnología del Sur (SUSTech), en colaboración con el Instituto IDEA y el Centro CCNL, ha lanzado SUS-Chat-34B, un modelo bilingüe (chino-inglés) con 34 mil millones de parámetros.
Este modelo ha demostrado un rendimiento excepcional en tareas en chino e inglés, superando a otros modelos con el mismo número de parámetros. SUS-Chat-34B se basa en el modelo preentrenado Yi-34B y se ha ajustado finamente utilizando millones de datos de instrucciones de alta calidad y multilingües.
El modelo se caracteriza por su capacidad para seguir instrucciones complejas a gran escala, su potente rendimiento en tareas generales, una ventana de contexto más amplia y una excelente capacidad para mantener conversaciones de varias rondas.