InternVL2_5-4B
Modelo de linguagem grande multimodal, que integra compreensão visual e linguística.
Produto ComumImagemMultimodalModelo de Linguagem Grande
InternVL2_5-4B é um modelo de linguagem grande multimodal (MLLM) avançado, que mantém a arquitetura central do modelo InternVL 2.0, com aprimoramentos significativos nas estratégias de treinamento e teste, e na qualidade dos dados. O modelo demonstra desempenho excepcional no processamento de imagens e tarefas de texto para texto, especialmente em raciocínio multimodal, resolução de problemas matemáticos, OCR, compreensão de gráficos e documentos. Como modelo de código aberto, ele oferece aos pesquisadores e desenvolvedores ferramentas poderosas para explorar e construir aplicativos inteligentes baseados em visão e linguagem.
InternVL2_5-4B Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44