智谱宣布推出GLM-4-9B系列模型,包括基座模型、不同上下文长度的Chat模型和视觉模型,能力全面超越了LLaMA38B。

image.png

GLM-4-9B es la versión de código abierto de la última generación de modelos preentrenados GLM-4 de智谱AI. En las evaluaciones de conjuntos de datos en varios aspectos, como semántica, matemáticas, razonamiento, código y conocimiento, tanto GLM-4-9B como su versión alineada con preferencias humanas, GLM-4-9B-Chat, mostraron un rendimiento superior a Llama-3-8B.

image.png

Además de poder realizar conversaciones de varias rondas, GLM-4-9B-Chat también cuenta con funciones avanzadas como navegación web, ejecución de código, llamada de herramientas personalizadas (Function Call) e inferencia de texto largo (con soporte para un contexto máximo de 128K).

Esta generación de modelos ha añadido soporte multilingüe, incluyendo 26 idiomas como japonés, coreano y alemán. También hemos lanzado el modelo GLM-4-9B-Chat-1M, que admite una longitud de contexto de 1M (aproximadamente 2 millones de caracteres chinos), y el modelo multimodal GLM-4V-9B basado en GLM-4-9B.

GLM-4V-9B tiene capacidad de conversación multilingüe chino-inglés en alta resolución de 1120*1120. En múltiples evaluaciones multimodales de capacidad integral chino-inglés, razonamiento perceptivo, reconocimiento de texto y comprensión de gráficos, GLM-4V-9B mostró un rendimiento superior a GPT-4-turbo-2024-04-09, Gemini1.0Pro, Qwen-VL-Max y Claude3Opus.

Los usuarios han expresado su esperanza de que la serie de modelos GLM-4-9B impulse el desarrollo de la tecnología de inteligencia artificial y esperan ver el lanzamiento de más productos inteligentes. Al mismo tiempo, han expresado su admiración por la capacidad técnica y la innovación de智谱.

Dirección del código abierto: https://github.com/THUDM/GLM-4

Dirección para probar el modelo: https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary