Modelos de la serie GLM-4-9B de código abierto de Zhipu: capacidades que superan ampliamente a LLaMA 3 8B

AIbase

Publicado elNoticias de IA · 3 minutos de lectura · Jun 5, 2024

671

智谱宣布推出GLM-4-9B系列模型，包括基座模型、不同上下文长度的Chat模型和视觉模型，能力全面超越了LLaMA38B。

GLM-4-9B es la versión de código abierto de la última generación de modelos preentrenados GLM-4 de智谱AI. En las evaluaciones de conjuntos de datos en varios aspectos, como semántica, matemáticas, razonamiento, código y conocimiento, tanto GLM-4-9B como su versión alineada con preferencias humanas, GLM-4-9B-Chat, mostraron un rendimiento superior a Llama-3-8B.

Además de poder realizar conversaciones de varias rondas, GLM-4-9B-Chat también cuenta con funciones avanzadas como navegación web, ejecución de código, llamada de herramientas personalizadas (Function Call) e inferencia de texto largo (con soporte para un contexto máximo de 128K).

Esta generación de modelos ha añadido soporte multilingüe, incluyendo 26 idiomas como japonés, coreano y alemán. También hemos lanzado el modelo GLM-4-9B-Chat-1M, que admite una longitud de contexto de 1M (aproximadamente 2 millones de caracteres chinos), y el modelo multimodal GLM-4V-9B basado en GLM-4-9B.

GLM-4V-9B tiene capacidad de conversación multilingüe chino-inglés en alta resolución de 1120*1120. En múltiples evaluaciones multimodales de capacidad integral chino-inglés, razonamiento perceptivo, reconocimiento de texto y comprensión de gráficos, GLM-4V-9B mostró un rendimiento superior a GPT-4-turbo-2024-04-09, Gemini1.0Pro, Qwen-VL-Max y Claude3Opus.

Los usuarios han expresado su esperanza de que la serie de modelos GLM-4-9B impulse el desarrollo de la tecnología de inteligencia artificial y esperan ver el lanzamiento de más productos inteligentes. Al mismo tiempo, han expresado su admiración por la capacidad técnica y la innovación de智谱.

Dirección del código abierto: https://github.com/THUDM/GLM-4

Dirección para probar el modelo: https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary

Plataforma Nacional de Internet de Supercomputación se integra con el modelo de lenguaje grande Qwen de Alibaba: API QwQ-32B disponible

Según los informes, la Plataforma Nacional de Internet de Supercomputación ha anunciado la integración con el modelo de lenguaje grande Qwen de Alibaba, ofreciendo oficialmente el servicio API de QwQ-32B. Los usuarios pueden obtener hasta 1 millón de tokens de forma gratuita al utilizar este servicio, lo que representa una excelente oportunidad para desarrolladores e investigadores. QwQ-32B es el último modelo de inferencia de código abierto del equipo de Alibaba Qwen, con un rendimiento excepcional. Según varios datos de evaluación autorizados, la capacidad de QwQ-32B es comparable a la del modelo de 671B a plena capacidad.

El Departamento de Justicia de EE. UU. exige a Google que venda Chrome y relaje las restricciones a las inversiones en IA

Según documentos judiciales recientes del Departamento de Justicia de EE. UU., se sigue exigiendo a Google que venda su navegador web Chrome. Esta propuesta, inicialmente planteada por el entonces presidente Biden el año pasado, se mantiene bajo la segunda administración de Trump. Sin embargo, el Departamento de Justicia ya no exige que Google se deshaga de todas sus inversiones en inteligencia artificial, incluyendo los miles de millones de dólares invertidos en Anthropic. En los documentos judiciales, el Departamento de Justicia afirma que las prácticas ilegales de Google han creado un gigante económico que ha tenido un impacto severo en el mercado, asegurando que Google, pase lo que pase...

Noticias de IA

Modelos de la serie GLM-4-9B de código abierto de Zhipu: capacidades que superan ampliamente a LLaMA 3 8B

AIbase

Noticias de IA relacionadas recomendadas

¡En solo cuatro semanas! Foxconn lanza FoxBrain, su modelo de lenguaje grande en chino

Plataforma Nacional de Internet de Supercomputación se integra con el modelo de lenguaje grande Qwen de Alibaba: API QwQ-32B disponible

El Departamento de Justicia de EE. UU. exige a Google que venda Chrome y relaje las restricciones a las inversiones en IA

Babel, el modelo de lenguaje grande de código abierto de Alibaba, admite 25 idiomas y empodera al 90% de la población mundial