LLaVA-वीडियो
वीडियो निर्देश ट्यूनिंग और सिंथेटिक डेटा अनुसंधान
सामान्य उत्पादवीडियोवीडियो समझमल्टीमॉडल लर्निंग
LLaVA-वीडियो एक बड़ा मल्टीमॉडल मॉडल (LMMs) है जो वीडियो निर्देश ट्यूनिंग पर केंद्रित है। यह इंटरनेट से बड़ी मात्रा में उच्च-गुणवत्ता वाले कच्चे डेटा प्राप्त करने की चुनौती का समाधान करने के लिए उच्च-गुणवत्ता वाले सिंथेटिक डेटासेट LLaVA-Video-178K बनाता है। इस डेटासेट में विस्तृत वीडियो विवरण, खुले अंत वाले प्रश्नोत्तर और बहुविकल्पीय प्रश्नोत्तर जैसे कार्य शामिल हैं, जिसका उद्देश्य वीडियो भाषा मॉडल की समझ और तर्क क्षमता में सुधार करना है। LLaVA-Video मॉडल कई वीडियो बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करता है, जो इसके डेटासेट की प्रभावशीलता को सिद्ध करता है।
LLaVA-वीडियो नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
80956
बाउंस दर
52.28%
प्रति विज़िट औसत पृष्ठ
1.2
औसत विज़िट अवधि
00:00:34