La plataforma abierta de inteligencia artificial de Zhipu AI anunció recientemente que el modelo GLM-4-Flash está oficialmente disponible para el público de forma gratuita. Los usuarios solo necesitan registrarse en bigmodel.cn para construir modelos y aplicaciones exclusivas de forma gratuita. Se espera que esta medida desencadene una nueva ola de innovación en el campo de las aplicaciones de IA.
El modelo GLM-4-Flash se caracteriza por su alta velocidad y rentabilidad, especialmente adecuado para tareas simples que requieren una respuesta rápida. El modelo admite conversaciones de varias rondas, navegación web, llamadas de funciones y razonamiento de texto largo, cubriendo 26 idiomas, incluidos chino, inglés, japonés, coreano, alemán, etc. Sus aplicaciones son amplias, incluyendo el preprocesamiento de datos de investigación, extracción de información, traducción multilingüe y conversaciones de varias rondas.
A nivel técnico, GLM-4-Flash ha optimizado su eficiencia operativa mediante la cuantificación adaptativa de pesos, la paralelización, las estrategias de procesamiento por lotes y el muestreo especulativo, lo que reduce significativamente el costo de inferencia. En la etapa de preentrenamiento, se utilizaron datos filtrados por modelos de lenguaje grandes, obteniendo más de 10 T de datos multilingües de alta calidad, más del triple que el modelo ChatGLM3-6B. Al mismo tiempo, la aplicación de la tecnología FP8 ha mejorado significativamente la eficiencia del preentrenamiento.
En términos de rendimiento, GLM-4-Flash ha demostrado un excelente rendimiento en las pruebas de capacidad de razonamiento lógico, con una velocidad de generación de 72.14 tokens/s (aproximadamente 115 caracteres/s), solo superado por GPT-3.5-turbo. Además, el modelo cuenta con la capacidad de búsqueda web en tiempo real, pudiendo acceder rápidamente a información como el tiempo y las noticias. Su capacidad de llamada a funciones es comparable a la de GPT-4.
Las aplicaciones de GLM-4-Flash ya han demostrado su potencial en varios campos. Los biólogos lo utilizan para procesar datos moleculares y explorar el código de la salud; los desarrolladores lo utilizan para generar datos de entrenamiento y ayudar al crecimiento de otros grandes modelos; los académicos universitarios crean asistentes de IA para mejorar la experiencia de aprendizaje; los desarrolladores de aplicaciones de traducción lo utilizan para desarrollar herramientas de aprendizaje interactivo de inglés para niños; y las empresas de publicidad lo utilizan para pulir textos y mejorar la eficiencia de la redacción.
Para fomentar la retroalimentación del usuario, la plataforma abierta de Zhipu AI también ofrece un beneficio de ajuste fino gratuito por tiempo limitado: al completar una encuesta, se puede obtener un paquete de recursos de entrenamiento de 5 millones de Tokens (3 meses). Las plazas son limitadas, ¡primero en llegar, primero en servir!
Dirección de acceso: https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash