智谱AI：API de GLM-4-Flash, un gran modelo lingüístico, ahora disponible gratuitamente para el público

AIbase基地

Publicado elNoticias de IA · 3 minutos de lectura · Aug 27, 2024

1.0k

Beijing Zhihu Hua Zhang Technology Co., Ltd. anunció recientemente que abrirá gratuitamente al público la interfaz de API de su modelo de lenguaje grande GLM-4-Flash, con el objetivo de promover la popularización y aplicación de la tecnología de modelos grandes.

El modelo GLM-4-Flash muestra ventajas significativas en velocidad y rendimiento, especialmente en la velocidad de inferencia. Mediante la adopción de medidas de optimización como la cuantificación adaptativa de pesos, el procesamiento paralelo, las estrategias de procesamiento por lotes y el muestreo especulativo, ha logrado una velocidad estable de hasta 72.14 tokens/s, un rendimiento destacado entre modelos similares.

智谱 AI

En cuanto a la optimización del rendimiento, el modelo GLM-4-Flash utilizó 10 TB de datos multilingües de alta calidad durante la fase de preentrenamiento. Esto permite que el modelo no solo maneje tareas como diálogos de varias rondas, búsqueda web y llamadas a herramientas, sino que también admita la inferencia de textos largos, con una longitud de contexto máxima de 128K. Además, el modelo admite 26 idiomas, incluyendo chino, inglés, japonés, coreano, alemán, etc., mostrando su potente capacidad multilingüe.

Para satisfacer las necesidades específicas de los diferentes usuarios, Zhihu AI también ofrece una función de ajuste fino del modelo, ayudando a los usuarios a adaptar mejor el modelo GLM-4-Flash a diversas aplicaciones. Esta iniciativa de Zhihu AI tiene como objetivo permitir que un grupo más amplio de usuarios experimente y utilice la tecnología avanzada de modelos grandes, ampliando aún más los límites de aplicación de la IA.

Dirección de la interfaz: https://open.bigmodel.cn/dev/api#glm-4

季逸超， fundador de Manus: Manus se basa en el modelo de lenguaje grande Qwen de Alibaba

Manus, el producto Agente de IA lanzado recientemente por la startup china Monica, ha generado un gran revuelo en la plataforma X. Hoy, su fundador, Ji Yichao, ha revelado más detalles técnicos a través de las redes sociales. Según Ji Yichao, Manus está desarrollado con el modelo de lenguaje grande Qwen de Alibaba y utiliza varios modelos ajustados para lograr sus funciones únicas. Esta noticia no solo ha generado debate en la industria sobre el origen de la tecnología de Manus, sino que también ha incrementado el interés de la comunidad global de IA en su potencial. Ji Yichao

Plataforma Nacional de Internet de Supercomputación se integra con el modelo de lenguaje grande Qwen de Alibaba: API QwQ-32B disponible

Según los informes, la Plataforma Nacional de Internet de Supercomputación ha anunciado la integración con el modelo de lenguaje grande Qwen de Alibaba, ofreciendo oficialmente el servicio API de QwQ-32B. Los usuarios pueden obtener hasta 1 millón de tokens de forma gratuita al utilizar este servicio, lo que representa una excelente oportunidad para desarrolladores e investigadores. QwQ-32B es el último modelo de inferencia de código abierto del equipo de Alibaba Qwen, con un rendimiento excepcional. Según varios datos de evaluación autorizados, la capacidad de QwQ-32B es comparable a la del modelo de 671B a plena capacidad.

Noticias de IA

智谱AI：API de GLM-4-Flash, un gran modelo lingüístico, ahora disponible gratuitamente para el público

AIbase基地

Noticias de IA relacionadas recomendadas

季逸超， fundador de Manus: Manus se basa en el modelo de lenguaje grande Qwen de Alibaba

¡En solo cuatro semanas! Foxconn lanza FoxBrain, su modelo de lenguaje grande en chino

Plataforma Nacional de Internet de Supercomputación se integra con el modelo de lenguaje grande Qwen de Alibaba: API QwQ-32B disponible

Babel, el modelo de lenguaje grande de código abierto de Alibaba, admite 25 idiomas y empodera al 90% de la población mundial