El Instituto de Inteligencia Artificial de Beijing (BAAI) ha lanzado Aquila2-34B, el modelo de lenguaje abierto chino-inglés más potente hasta la fecha. Este nuevo modelo destaca por su excelente rendimiento en inferencia y generalización, logrando resultados significativos en diversas aplicaciones como agentes inteligentes, generación de código y recuperación de información.
BAAI también ha lanzado un conjunto completo de herramientas de código abierto, incluyendo la serie de modelos Aquila2, una nueva versión del modelo de vectores semánticos BGE, el framework de entrenamiento paralelo de alta eficiencia FlagScale y el conjunto de operadores de atención de alto rendimiento FlagAttention. Estos proyectos de código abierto impulsarán la innovación colaborativa en la investigación de modelos de lenguaje a gran escala.
El modelo base Aquila2-34B supera a otros modelos base de código abierto en términos de capacidad general. El equipo de BAAI también ha desarrollado el método NLPE para mejorar las capacidades de extrapolación del modelo. En cuanto a la capacidad de inferencia, Aquila2-34B se sitúa solo por detrás de GPT-4.