InternVL2_5-8B-MPO-AWQ

Modelo de linguagem de grande porte multimodal, que aprimora a interação entre visão e linguagem.

Produto ComumImagemMultimodalModelo de Linguagem de Grande Porte
InternVL2_5-8B-MPO-AWQ é um modelo de linguagem de grande porte multimodal lançado pelo OpenGVLab, baseado na série InternVL2.5 e que utiliza a tecnologia de Otimização de Preferência Mista (Mixed Preference Optimization, MPO). O modelo demonstra desempenho excepcional na compreensão e geração de linguagem e visão, especialmente em tarefas multimodais. Combinando a parte visual InternViT e a parte de linguagem InternLM ou Qwen, e utilizando um projetor MLP com inicialização aleatória para pré-treinamento incremental, ele consegue uma compreensão e interação profundas entre imagens e texto. A importância dessa tecnologia reside na capacidade de processar diversos tipos de dados, incluindo imagens únicas, múltiplas imagens e dados de vídeo, oferecendo novas soluções para o campo da inteligência artificial multimodal.
Abrir Site

InternVL2_5-8B-MPO-AWQ Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

InternVL2_5-8B-MPO-AWQ Tendência de Visitas

InternVL2_5-8B-MPO-AWQ Distribuição Geográfica das Visitas

InternVL2_5-8B-MPO-AWQ Fontes de Tráfego

InternVL2_5-8B-MPO-AWQ Alternativas