InternVL2_5-26B-MPO

Modelo de linguagem grande multimodal que aprimora a interação entre visão e linguagem.

Produto ComumImagemMultimodalModelo de Linguagem Grande
InternVL2_5-26B-MPO é um modelo de linguagem grande multimodal (MLLM) que, baseado no InternVL2.5, aprimora ainda mais o desempenho do modelo por meio da otimização de preferência mista (Mixed Preference Optimization, MPO). Este modelo consegue processar dados multimodais, incluindo imagens e texto, e é amplamente aplicado em cenários como descrição de imagens e perguntas e respostas visuais. Sua importância reside na capacidade de compreender e gerar texto intimamente relacionado ao conteúdo da imagem, impulsionando os limites da inteligência artificial multimodal. As informações de contexto do produto incluem seu desempenho excepcional em tarefas multimodais e os resultados de avaliação no OpenCompass Learderboard. O modelo oferece aos pesquisadores e desenvolvedores uma ferramenta poderosa para explorar e realizar o potencial da inteligência artificial multimodal.
Abrir Site

InternVL2_5-26B-MPO Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

InternVL2_5-26B-MPO Tendência de Visitas

InternVL2_5-26B-MPO Distribuição Geográfica das Visitas

InternVL2_5-26B-MPO Fontes de Tráfego

InternVL2_5-26B-MPO Alternativas