2025-03-10 16:04:04.AIbase.
Huawei Ascend y Step-Video lanzan un modelo multimodal de código abierto para incursionar en nuevas áreas de la IA
2025-03-09 11:04:41.AIbase.
¡Gran avance en la IA de avatares digitales! Hedra lanza Character-3 y Hedra Studio: inferencia conjunta de imagen, texto y audio
2025-03-06 14:54:02.AIbase.
Cohere lanza Aya Vision, un nuevo modelo de IA multimodal, en versiones de 32B y 8B
2025-03-06 14:46:43.AIbase.
¡Gran avance en la recuperación multimodal!智源 publica el modelo de vector multimodal BGE-VL
2025-03-04 09:41:14.AIbase.
Huake Byte lanza Liquid: Redefiniendo la generación y comprensión de modelos multimodales
2025-03-03 16:52:09.AIbase.
Shenzhen lanza un plan de acción para la innovación tecnológica en robots inteligentes encarnados, centrado en la construcción de modelos grandes multimodales
2025-02-28 14:00:59.AIbase.
Baidu lanzará el modelo de lenguaje grande Wenxin 4.5 el 16 de marzo con capacidades multimodales nativas y de pensamiento profundo
2025-02-27 15:56:53.AIbase.
Se espera que Baidu Ernie 4.5 se lance a mediados de marzo, mejorando el razonamiento y las capacidades multimodales
2025-02-27 09:38:31.AIbase.
Microsoft lanza Phi-4, un modelo multimodal y miniaturizado que mejora el procesamiento de voz, visión y texto
2025-02-26 11:11:32.AIbase.
Magma: El agente de IA multimodal de código abierto de Microsoft que revoluciona las compras y la robótica
2025-02-26 09:13:48.AIbase.
Microsoft lanza el agente de IA multimodal de código abierto "Magma": capaz de realizar pedidos automáticos y predicciones de comportamiento
2025-02-25 11:15:31.AIbase.
Familia de mapaches de SenseTime totalmente mejorada: fusión multimodal, replica páginas web en 10 segundos
2025-02-21 17:23:48.AIbase.
Modelo de lenguaje grande multimodal de la serie Ovis2 de Alibaba International, de código abierto, con seis versiones
2025-02-21 15:58:33.AIbase.
Lanzamiento de los dos nuevos modelos multimodales de código abierto de Step-Star en la plataforma ModelScope de Alibaba Cloud
2025-02-21 10:31:23.AIbase.
腾讯元宝推出「Comprensión de imágenes」habilidad con la combinación de modelos «Hun Yuan + DeepSeek»
2025-02-20 16:44:24.AIbase.
VLM-R1: Una nueva era para los modelos de lenguaje visual. Un gran avance en la IA multimodal
2025-02-20 09:30:11.AIbase.
Microsoft presenta Magma: un modelo de IA multimodal que integra visión, lenguaje y habilidades de toma de decisiones
2025-02-18 08:55:51.AIbase.
¡El mejor efecto! Modelo de generación de video Step-Video-T2V de código abierto de Step-Star
2025-02-13 16:48:41.AIbase.
Baidu Ernie completamente gratis: El plan de reembolso para miembros se publica oficialmente
2025-02-13 10:22:36.AIbase.