InternVL2_5-4B

Modelo de linguagem grande multimodal, que integra compreensão visual e linguística.

Produto ComumImagemMultimodalModelo de Linguagem Grande
InternVL2_5-4B é um modelo de linguagem grande multimodal (MLLM) avançado, que mantém a arquitetura central do modelo InternVL 2.0, com aprimoramentos significativos nas estratégias de treinamento e teste, e na qualidade dos dados. O modelo demonstra desempenho excepcional no processamento de imagens e tarefas de texto para texto, especialmente em raciocínio multimodal, resolução de problemas matemáticos, OCR, compreensão de gráficos e documentos. Como modelo de código aberto, ele oferece aos pesquisadores e desenvolvedores ferramentas poderosas para explorar e construir aplicativos inteligentes baseados em visão e linguagem.
Abrir Site

InternVL2_5-4B Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

InternVL2_5-4B Tendência de Visitas

InternVL2_5-4B Distribuição Geográfica das Visitas

InternVL2_5-4B Fontes de Tráfego

InternVL2_5-4B Alternativas