MiniCPM-V 2.6
Modelo de linguagem multimodal de alto desempenho, adequado para compreensão de imagens e vídeos.
Produto ComumImagemMultimodalCompreensão de Imagens
O MiniCPM-V 2.6 é um grande modelo de linguagem multimodal baseado em 800 milhões de parâmetros, que demonstra desempenho de ponta em várias áreas, incluindo compreensão de imagens únicas, compreensão de múltiplas imagens e compreensão de vídeo. O modelo obteve uma pontuação média de 65,2 em vários benchmarks populares, como o OpenCompass, superando modelos proprietários amplamente utilizados. Ele também possui capacidades robustas de OCR, suporta vários idiomas e apresenta excelente eficiência, permitindo a compreensão de vídeo em tempo real em dispositivos como iPads.
MiniCPM-V 2.6 Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44