Megrez-3B-Omni
Modelo de compreensão multimodal de ponta aberto
Produto ComumProdutividadeCompreensão MultimodalReconhecimento de Imagem
Megrez-3B-Omni é um modelo de compreensão multimodal de ponta desenvolvido pela Wu Wenxin Qiong, baseado na extensão do modelo de linguagem grande Megrez-3B-Instruct. Ele possui a capacidade de entender e analisar dados de três modalidades: imagem, texto e áudio. Este modelo alcançou a precisão ideal em compreensão de imagem, compreensão de linguagem e compreensão de voz, suporta entrada de voz em chinês e inglês e diálogos multilíngues, suporta perguntas de voz sobre imagens de entrada e responde diretamente com texto de acordo com as instruções de voz, obtendo resultados de ponta em várias tarefas de referência.
Megrez-3B-Omni Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44