Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

智谱发布新一代基础模型GLM-4-Plus，清言APP升级视频通话功能

AIbase基地

Publicado elNoticias de IA · 6 minutos de lectura · Aug 29, 2024

475

Beijing Zhipu Huazhang Technology Co., Ltd. anunció una serie de importantes actualizaciones tecnológicas el 29 de agosto de 2024, incluyendo el lanzamiento de un modelo base de nueva generación y nuevos servicios de aplicación.

En la conferencia KDD2024, Zhipu lanzó una nueva generación de modelos base, incluyendo el modelo de lenguaje GLM-4-Plus, el modelo de generación de imágenes a partir de texto CogView-3-Plus, el modelo de comprensión de imágenes/vídeo GLM-4V-Plus y el modelo de generación de vídeo CogVideoX. Estos modelos han alcanzado un nivel líder a nivel internacional en sus respectivos campos.

El modelo GLM-4-Plus ha mejorado significativamente su rendimiento en comprensión del lenguaje, seguimiento de instrucciones y procesamiento de textos largos, situándose a la par de modelos de primera línea como GPT-4o. El modelo CogView-3-Plus utiliza la arquitectura Transformer en lugar de la arquitectura UNet tradicional, optimizando los resultados del modelo y alcanzando un rendimiento cercano a modelos de primer nivel como MJ-V6 y FLUX. El modelo GLM-4V-Plus cuenta con una capacidad de comprensión de imágenes y vídeo de alta calidad, convirtiéndose en la primera API de comprensión de vídeo general en China. El modelo CogVideoX, tras el lanzamiento de la versión 2B, ha abierto aún más la versión 5B, mejorando su rendimiento y convirtiéndose en uno de los mejores modelos de generación de vídeo de código abierto actuales.

微信截图_20240830075752.png

Además, Zhipu ha lanzado en la aplicación "Qingyan APP" el primer servicio de videollamada para usuarios finales en China. Este servicio abarca las modalidades de texto, audio y vídeo, y cuenta con capacidad de inferencia en tiempo real, ofreciendo a los usuarios una experiencia de interacción fluida.

Zhipu también anunció el uso gratuito de la API GLM-4-Flash, que ofrece ventajas en velocidad y rendimiento, permitiendo a los usuarios construir modelos y aplicaciones exclusivas de forma rápida y gratuita. Al mismo tiempo, para satisfacer las necesidades de diferentes usuarios, Zhipu ofrece la función de ajuste fino del modelo.

Zhipu afirma que continuará avanzando para que las máquinas piensen como las personas, ofreciendo a los usuarios tecnología y servicios más avanzados.

Actualizaciones principales:

Modelo base de lenguaje GLM-4-Plus: Ha mejorado significativamente su rendimiento en comprensión del lenguaje, seguimiento de instrucciones y procesamiento de textos largos, manteniendo su liderazgo internacional.
Modelo base de generación de imágenes a partir de texto CogView-3-Plus: Ofrece un rendimiento comparable a los mejores modelos actuales, como MJ-V6 y FLUX.
Modelo base de comprensión de imágenes/vídeo GLM-4V-Plus: Ofrece una excelente capacidad de comprensión de imágenes y una capacidad de comprensión de vídeo basada en la percepción temporal. Este modelo estará disponible en la plataforma abierta (bigmodel.cn) y se convertirá en la primera API de comprensión de vídeo general en China.
Modelo base de generación de vídeo CogVideoX: Tras el lanzamiento y la apertura del código fuente de la versión 2B, la versión 5B también se ha abierto oficialmente, mejorando aún más su rendimiento y convirtiéndose en la mejor opción entre los modelos de generación de vídeo de código abierto actuales.
Videollamada en "Qingyan APP": El primer servicio de videollamada abierto para usuarios finales en China. La función de videollamada de "Qingyan APP" abarca las modalidades de texto, audio y vídeo, y cuenta con capacidad de inferencia en tiempo real.
API GLM-4-Flash: El servicio de inferencia es totalmente gratuito y ofrece servicio de ajuste fino.

Enlace de solicitud del servicio de videollamada:

https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf

智谱华章 GLM-4-Plus CogView-3-Plus CogVideoX

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

智谱AI：Agentic GLM llega a la serie Samsung Galaxy S25

El 11 de febrero de 2025, Beijing ZhiPu HuaZhang Technology Co., Ltd. anunció que su Agentic GLM estará disponible en la última serie de teléfonos Samsung Galaxy S25. Esta colaboración marca el lanzamiento oficial al mercado del primer teléfono inteligente del mundo compatible con la interacción de IA multimodal, ofreciendo a los usuarios una experiencia inteligente sin precedentes. ZhiPu HuaZhang comenzó su investigación sobre agentes inteligentes en abril de 2023 y lanzó su primer producto Agent, AutoGLM, en octubre de 2024, siendo pionera en la propuesta de Phone

Feb 12, 2025

2.5k

Experiencia abierta de智谱GLM-PC: Actualización del agente multimodal que opera computadoras de forma autónoma

智谱华章科技有限公司近日宣布其旗下的智谱 GLM-PC 智能体已进行升级，并正式向公众开放体验。Como el primer agente multimodal del mundo capaz de operar computadoras de forma autónoma, GLM-PC se basa en el modelo multimodal a gran escala CogAgent de智谱. Los usuarios solo necesitan presionar Intro para experimentar este revolucionario asistente inteligente para computadoras. Desde el lanzamiento de GLM-PC v1.0 el 29 de noviembre de 2024, ha estado en fase de prueba interna. Esta versión aporta...

Jan 23, 2025

4.4k

¡Prueba gratuita! 智谱 lanza Qingying 2.0, su producto de video AI, ya disponible en 智谱清言

Qingying 2.0 ha experimentado una mejora integral en la estructura del modelo, los métodos de entrenamiento y la ingeniería de datos, lo que ha resultado en una mejora significativa del 38% en la capacidad del modelo base. Esta mejora permite a Qingying 2.0 generar contenido de video con movimientos más naturales, imágenes más hermosas y un control más estable. Los usuarios solo necesitan ingresar palabras clave simples para que el sujeto de la imagen en el video realice movimientos amplios, manteniendo al mismo tiempo la estabilidad de la imagen. Por ejemplo, Qingying 2.0 puede generar una secuencia de acciones coherentes de un hombre saliendo de un póster, ajustándose la corbata y realizando un primer plano, lo que demuestra su capacidad en la coherencia de los movimientos y la estabilidad de la imagen.

Jan 21, 2025

3.5k

智谱发布GLM-4-Air、GLM-4V-Plus模型，推出Flash全模态免费模型

智谱华章科技有限公司于2025年1月16日宣布在bigmodel.cn上线一系列新模型。继8月推出「智谱清言」后，公司在语言、语音、图像和视频的理解和生成领域持续深耕，推出了GLM-Voice、GLM-4V、CogView、CogVideoX等多模态模型。

Jan 16, 2025

5.6k

智谱与中国三星宣布战略合作：在AI手机领域展开深度共创

Samsung China y智谱华章科技有限公司 (en adelante, “智谱”) anunciaron recientemente un acuerdo de cooperación estratégica. Ambas partes llevarán a cabo una profunda colaboración en el campo de los teléfonos inteligentes con IA, con el objetivo de crear conjuntamente productos de IA con una experiencia excelente. De cara al futuro, Samsung y 智谱 continuarán innovando en el campo de los teléfonos inteligentes con IA, creando conjuntamente productos inteligentes líderes en la industria y uniendo fuerzas para abrir un nuevo capítulo en el desarrollo de la industria de las comunicaciones móviles con IA.

Oct 23, 2024

3.0k