Un ancien élève de l'université de Zhejiang, en collaboration avec les laboratoires de recherche Microsoft, a lancé LLaVA, un modèle multi-modal qui rivalise avec GPT-4V. LLaVA a démontré d'excellentes performances sur 11 ensembles de données de test, obtenant plus de 6000 étoiles. Ses capacités globales surpassent celles de GPT-4V dans 85% des cas. Le code source, le modèle et les données d'entraînement de LLaVA sont désormais accessibles.
Des anciens élèves de l'Université de Zhejiang collaborent avec Microsoft pour lancer le modèle multimodal LLaVA, remettant en question GPT-4V

量子位
Cet article provient d'AIbase Daily
Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.