2025-03-06 14:46:43.AIbase.
Nova descoberta em busca multimodal! Modelo de vetor multimodal BGE-VL de código aberto do Instituto de Inteligência Artificial de Pequim
2025-02-28 17:16:20.AIbase.
Netflix contrata cientistas e engenheiros de aprendizado de máquina para impulsionar a inteligência de conteúdo
2025-02-26 09:13:48.AIbase.
Microsoft lança o agente de IA multimodal de código aberto “Magma”: capaz de fazer pedidos automáticos e prever comportamentos
2025-02-25 11:15:31.AIbase.
Família de Guaxinins da SenseTime totalmente atualizada: Fusão multimodal, replicação de páginas da web em 10 segundos
2025-02-20 09:30:11.AIbase.
Modelo de IA multimodal Magma da Microsoft: integrando habilidades de visão, linguagem e tomada de decisão de ação
2025-02-18 08:55:51.AIbase.
Resultados de ponta! Modelo de geração de vídeo Step-Video-T2V de código aberto da Step-Star
2025-02-10 11:04:17.AIbase.
Meta AI lança o sistema MILS para ensinar LLMs a processar dados multimídia sem treinamento específico
2025-02-10 09:46:56.AIbase.
Pequeno e poderoso! Microsoft lança o modelo pequeno LLaVA-Rad para geração precisa de relatórios de radiologia
2025-01-28 10:34:39.AIbase.
DeepSeek lança novo modelo multimodal de IA, Janus-Pro, com recursos aprimorados
2025-01-21 11:20:27.AIbase.
O Lado Escuro da Lua lança o modelo SOTA k1.5 de próxima geração: capacidade de raciocínio multimodal aprimorada
2025-01-15 10:39:44.AIbase.
Nova estrutura VideoRAG: Aprimorando a precisão das respostas de consulta usando conteúdo de vídeo
2025-01-15 08:41:23.AIbase.
A Alibaba DAMO Academy lança o modelo multimodal Valley 2 para cenários de comércio eletrônico
2025-01-14 14:02:29.AIbase.
A Step-1V, da Jieyue Xingchen, e a Chá Baodao firmam parceria estratégica; lojas já utilizam o modelo de linguagem multimodal
2025-01-13 09:21:47.AIbase.
Sa2VA: Uma estrutura de IA integrada para compreensão profunda de imagens e vídeos
2025-01-09 16:19:04.AIbase.
Tecnologia SenseTime impulsiona atualização da cabine inteligente: o primeiro sistema de reconhecimento multimodal em streaming do mundo chega a veículos de produção em massa
2025-01-08 17:12:51.AIbase.
Ex-especialista em visão da Microsoft, Hu Han, junta-se à Tencent para liderar o desenvolvimento de modelos de linguagem multimodais
2025-01-08 17:10:10.AIbase.
Ex-especialista em visão da Microsoft, Hu Han, junta-se à Tencent para liderar o desenvolvimento do modelo multimodal HunYuan
2025-01-07 09:30:32.AIbase.
Nível GPT-4o! VITA-1.5: Interação visual e de voz em tempo real, com latência de 1,5 segundos
2024-12-31 11:08:11.AIbase.
Matriz Ilimitada fecha rodada anjo de milhões, visando criar um mentor de IA multimodal
2024-12-30 11:32:22.AIbase.