InternVL2_5-26B-MPO
Modelo de linguagem grande multimodal que aprimora a interação entre visão e linguagem.
Produto ComumImagemMultimodalModelo de Linguagem Grande
InternVL2_5-26B-MPO é um modelo de linguagem grande multimodal (MLLM) que, baseado no InternVL2.5, aprimora ainda mais o desempenho do modelo por meio da otimização de preferência mista (Mixed Preference Optimization, MPO). Este modelo consegue processar dados multimodais, incluindo imagens e texto, e é amplamente aplicado em cenários como descrição de imagens e perguntas e respostas visuais. Sua importância reside na capacidade de compreender e gerar texto intimamente relacionado ao conteúdo da imagem, impulsionando os limites da inteligência artificial multimodal. As informações de contexto do produto incluem seu desempenho excepcional em tarefas multimodais e os resultados de avaliação no OpenCompass Learderboard. O modelo oferece aos pesquisadores e desenvolvedores uma ferramenta poderosa para explorar e realizar o potencial da inteligência artificial multimodal.
InternVL2_5-26B-MPO Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44