Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

智谱发布GLM-4-Air、GLM-4V-Plus模型，推出Flash全模态免费模型

AIbase基地

Publicado elNoticias de IA · 6 minutos de lectura · Jan 16, 2025

556

Beijing Zhihu Hua Zhang Technology Co., Ltd. anunció el 16 de enero de 2025 el lanzamiento de una serie de nuevos modelos, disponibles en bigmodel.cn. Tras el lanzamiento de "Zhispu Qingyan" en agosto, la compañía ha profundizado en la exploración de la comprensión y generación de lenguaje, voz, imágenes y vídeo, lanzando modelos multimodales como GLM-Voice, GLM-4V, CogView y CogVideoX.

El nuevo modelo de extremo a extremo GLM-Realtime, lanzado en esta ocasión, permite la comprensión de vídeo y la interacción de voz con baja latencia. Incorpora una función de canto y admite una memoria de hasta 2 minutos, además de la función Function Call. La compañía también ha actualizado simultáneamente los modelos GLM-4-Air y GLM-4V-Plus, con el objetivo de ofrecer soluciones de modelos lingüísticos con la mejor relación precio-rendimiento del sector. Zhihu se compromete a devolver a la sociedad los avances en la tecnología de modelos grandes, y ha creado específicamente el modelo multi-modal gratuito Flash, que abarca varios escenarios como lenguaje, generación de imágenes a partir de texto, generación de vídeo a partir de texto y comprensión de imágenes, para ayudar a los desarrolladores a innovar fácilmente en sus aplicaciones.

微信截图_20250116150923.png

GLM-Realtime tiene una capacidad de memoria de 2 minutos en videollamadas y, en cuanto a la interacción de voz, ha implementado innovadoramente una función de canto, lo que permite al modelo grande cantar durante una conversación. La compañía ha integrado la API de Realtime en gafas inteligentes y muñecos de compañía para que los usuarios puedan experimentar una interacción con asistentes inteligentes casi en tiempo real. Realtime también admite la función Function Call, lo que le permite utilizar su propio conocimiento y capacidades para llamar de forma flexible a conocimientos y herramientas externas, expandiéndose a escenarios comerciales más amplios. La API de GLM-Realtime ya está disponible en la plataforma abierta de Zhihu, bigmodel.cn, y actualmente es de uso gratuito.

GLM-4-Air ha sido muy popular entre los desarrolladores desde su lanzamiento debido a su excelente relación calidad-precio. En esta ocasión, se ha actualizado completamente a GLM-4-Air-0111. Mediante la optimización de los datos y el proceso de entrenamiento, su rendimiento en algunas dimensiones se acerca al de GLM-4-Plus, que es de mayor escala, mientras que el precio del modelo se ha reducido al 50%, lo que reduce el umbral de aplicación de los modelos grandes. El modelo de comprensión visual GLM-4V-Plus también se ha actualizado completamente. La nueva versión ha mejorado significativamente en varias listas de clasificación públicas, admite la función de resolución variable, se adapta a la entrada de imágenes de diferentes tamaños, reduce significativamente el consumo de tokens en escenas con imágenes pequeñas, admite el reconocimiento sin pérdidas de imágenes de 4K ultra HD y de relación de aspecto extremadamente larga, y tiene una capacidad de comprensión de vídeo de hasta 2 horas, proporcionando una solución eficiente y precisa para la comprensión y el análisis de vídeos largos.

Zhihu se dedica a la democratización de los modelos grandes y, para ayudar a los desarrolladores a innovar, ha creado una API de modelos Flash gratuitos para toda la sociedad. Como la primera serie de modelos gratuitos multimodales del sector, los desarrolladores pueden utilizar gratuitamente las funciones de lenguaje, comprensión multimodal y generación multimodal. Recientemente, la serie Flash se actualizará completamente, incluyendo el modelo lingüístico GLM-4-Flash, el modelo de comprensión de imágenes GLM-4V-Flash, el modelo de generación de imágenes CogView-3-Flash y el modelo de generación de vídeo CogVideoX-Flash.

智谱华章 GLM-Voice CogView Flash全模态免费模型

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

智谱AI：Agentic GLM llega a la serie Samsung Galaxy S25

El 11 de febrero de 2025, Beijing ZhiPu HuaZhang Technology Co., Ltd. anunció que su Agentic GLM estará disponible en la última serie de teléfonos Samsung Galaxy S25. Esta colaboración marca el lanzamiento oficial al mercado del primer teléfono inteligente del mundo compatible con la interacción de IA multimodal, ofreciendo a los usuarios una experiencia inteligente sin precedentes. ZhiPu HuaZhang comenzó su investigación sobre agentes inteligentes en abril de 2023 y lanzó su primer producto Agent, AutoGLM, en octubre de 2024, siendo pionera en la propuesta de Phone

Feb 12, 2025

2.5k

Experiencia abierta de智谱GLM-PC: Actualización del agente multimodal que opera computadoras de forma autónoma

智谱华章科技有限公司近日宣布其旗下的智谱 GLM-PC 智能体已进行升级，并正式向公众开放体验。Como el primer agente multimodal del mundo capaz de operar computadoras de forma autónoma, GLM-PC se basa en el modelo multimodal a gran escala CogAgent de智谱. Los usuarios solo necesitan presionar Intro para experimentar este revolucionario asistente inteligente para computadoras. Desde el lanzamiento de GLM-PC v1.0 el 29 de noviembre de 2024, ha estado en fase de prueba interna. Esta versión aporta...

Jan 23, 2025

4.4k

¡Prueba gratuita! 智谱 lanza Qingying 2.0, su producto de video AI, ya disponible en 智谱清言

Qingying 2.0 ha experimentado una mejora integral en la estructura del modelo, los métodos de entrenamiento y la ingeniería de datos, lo que ha resultado en una mejora significativa del 38% en la capacidad del modelo base. Esta mejora permite a Qingying 2.0 generar contenido de video con movimientos más naturales, imágenes más hermosas y un control más estable. Los usuarios solo necesitan ingresar palabras clave simples para que el sujeto de la imagen en el video realice movimientos amplios, manteniendo al mismo tiempo la estabilidad de la imagen. Por ejemplo, Qingying 2.0 puede generar una secuencia de acciones coherentes de un hombre saliendo de un póster, ajustándose la corbata y realizando un primer plano, lo que demuestra su capacidad en la coherencia de los movimientos y la estabilidad de la imagen.

Jan 21, 2025

3.5k

智谱与中国三星宣布战略合作：在AI手机领域展开深度共创

Samsung China y智谱华章科技有限公司 (en adelante, “智谱”) anunciaron recientemente un acuerdo de cooperación estratégica. Ambas partes llevarán a cabo una profunda colaboración en el campo de los teléfonos inteligentes con IA, con el objetivo de crear conjuntamente productos de IA con una experiencia excelente. De cara al futuro, Samsung y 智谱 continuarán innovando en el campo de los teléfonos inteligentes con IA, creando conjuntamente productos inteligentes líderes en la industria y uniendo fuerzas para abrir un nuevo capítulo en el desarrollo de la industria de las comunicaciones móviles con IA.

Oct 23, 2024

3.0k

智谱发布新一代基础模型GLM-4-Plus，清言APP升级视频通话功能

El 29 de agosto de 2024, Beijing ZhiPu HuaZhang Technology Co., Ltd. anunció una serie de importantes actualizaciones tecnológicas, incluyendo el lanzamiento de un nuevo modelo base y nuevos servicios de aplicación. En la conferencia KDD2024, ZhiPu lanzó una nueva generación de modelos base, incluyendo el modelo de lenguaje GLM-4-Plus, el modelo de generación de imágenes CogView-3-Plus, el modelo de comprensión de imágenes/video GLM-4V-Plus y el modelo de generación de video CogVideoX. Estos modelos han alcanzado un nivel líder internacional en sus respectivos campos.

Aug 30, 2024

4.8k