InternVL2_5-8B-MPO-AWQ
Modelo de linguagem de grande porte multimodal, que aprimora a interação entre visão e linguagem.
Produto ComumImagemMultimodalModelo de Linguagem de Grande Porte
InternVL2_5-8B-MPO-AWQ é um modelo de linguagem de grande porte multimodal lançado pelo OpenGVLab, baseado na série InternVL2.5 e que utiliza a tecnologia de Otimização de Preferência Mista (Mixed Preference Optimization, MPO). O modelo demonstra desempenho excepcional na compreensão e geração de linguagem e visão, especialmente em tarefas multimodais. Combinando a parte visual InternViT e a parte de linguagem InternLM ou Qwen, e utilizando um projetor MLP com inicialização aleatória para pré-treinamento incremental, ele consegue uma compreensão e interação profundas entre imagens e texto. A importância dessa tecnologia reside na capacidade de processar diversos tipos de dados, incluindo imagens únicas, múltiplas imagens e dados de vídeo, oferecendo novas soluções para o campo da inteligência artificial multimodal.
InternVL2_5-8B-MPO-AWQ Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44