Un ancien élève de l'université de Zhejiang, en collaboration avec les laboratoires de recherche Microsoft, a lancé LLaVA, un modèle multi-modal qui rivalise avec GPT-4V. LLaVA a démontré d'excellentes performances sur 11 ensembles de données de test, obtenant plus de 6000 étoiles. Ses capacités globales surpassent celles de GPT-4V dans 85% des cas. Le code source, le modèle et les données d'entraînement de LLaVA sont désormais accessibles.
Des anciens élèves de l'Université de Zhejiang collaborent avec Microsoft pour lancer le modèle multimodal LLaVA, remettant en question GPT-4V
