Un ancien élève de l'université de Zhejiang, en collaboration avec les laboratoires de recherche Microsoft, a lancé LLaVA, un modèle multi-modal qui rivalise avec GPT-4V. LLaVA a démontré d'excellentes performances sur 11 ensembles de données de test, obtenant plus de 6000 étoiles. Ses capacités globales surpassent celles de GPT-4V dans 85% des cas. Le code source, le modèle et les données d'entraînement de LLaVA sont désormais accessibles.