Valley est un grand modèle multimodale (MLLM) développé par ByteDance, conçu pour traiter diverses tâches impliquant des données textuelles, des images et des vidéos. Ce modèle a obtenu les meilleurs résultats lors de tests internes d'e-commerce et de vidéos courtes, surpassant largement les autres modèles open source, et a démontré d'excellentes performances sur le classement OpenCompass des modèles multimodaux, avec un score moyen de 67,40, se classant parmi les deux meilleurs MLLM open source connus (<10B).