Ein Absolvent der ZheJiang Universität (ZJU) hat in Zusammenarbeit mit dem Microsoft Research ein multimodales Modell namens LLaVA entwickelt, das GPT-4V herausfordert. LLaVA erzielte in 11 Testdatensätzen hervorragende Ergebnisse und erhielt über 6.000 Sterne auf GitHub. Das Modell zeichnet sich durch seine hohe Gesamtperformance aus und übertrifft GPT-4V in 85% der Fälle. Der Open-Source-Code, das Modell und die Trainingsdaten von LLaVA stehen bereits zur Verfügung.
ZJU-Alumni und Microsoft präsentieren multimodales Modell LLaVA, eine Herausforderung für GPT-4V

量子位
69
© Alle Rechte vorbehalten AIbase-Basis 2024, klicken Sie hier, um die Quelle anzuzeigen - https://www.aibase.com/de/news/2007