Valley 2.0
Modelo de linguagem grande multi-modal, aprimora a capacidade de processamento de dados de texto, imagem e vídeo.
Produto ComumOutrosMultimodalModelo de Linguagem Grande
Valley é um modelo de linguagem grande multi-modal (MLLM) desenvolvido pela ByteDance, projetado para lidar com várias tarefas que envolvem dados de texto, imagem e vídeo. O modelo alcançou os melhores resultados em testes internos de e-commerce e vídeos curtos, superando em muito outros modelos de código aberto, e demonstrou desempenho excepcional no ranking de avaliação de modelos multi-modais OpenCompass, com uma pontuação média de 67,40, classificando-se entre os dois primeiros MLLMs (<10B) de código aberto conhecidos.