Valley 2.0
Modelo de lenguaje grande multimodal que mejora el procesamiento de datos de texto, imágenes y vídeo.
Producto ComúnOtrosMultimodalModelo de lenguaje grande
Valley es un modelo de lenguaje grande multimodal (MLLM) desarrollado por ByteDance, diseñado para manejar diversas tareas que involucran datos de texto, imágenes y vídeo. El modelo ha obtenido los mejores resultados en pruebas internas de comercio electrónico y vídeos cortos, superando con creces a otros modelos de código abierto, y ha demostrado un rendimiento excepcional en la clasificación de modelos multimodales OpenCompass, con una puntuación media de 67,40, situándose entre los dos primeros de los MLLM de código abierto conocidos (<10B).