SmolVLM-256M-निर्देश
SmolVLM-256M विश्व का सबसे छोटा बहुविधा मॉडल है, जो चित्र और पाठ इनपुट को कुशलतापूर्वक संसाधित करता है और पाठ आउटपुट उत्पन्न करता है।
सामान्य उत्पादछविबहुविधाछवि प्रसंस्करण
SmolVLM-256M एक बहुविधा मॉडल है जिसे Hugging Face ने विकसित किया है, जो Idefics3 आर्किटेक्चर पर आधारित है और विशेष रूप से चित्र और पाठ इनपुट को कुशलतापूर्वक संसाधित करने के लिए डिज़ाइन किया गया है। यह चित्रों के बारे में प्रश्नों का उत्तर दे सकता है, दृश्य सामग्री का वर्णन कर सकता है या पाठ को ट्रांसक्राइब कर सकता है, और इसके लिए केवल 1GB से भी कम GPU मेमोरी की आवश्यकता होती है। यह मॉडल बहुविधा कार्यों में उत्कृष्ट प्रदर्शन करता है, साथ ही हल्के आर्किटेक्चर को बनाए रखता है, जो इसे उपकरणों पर अनुप्रयोगों के लिए उपयुक्त बनाता है। इसका प्रशिक्षण डेटा The Cauldron और Docmatix डेटासेट से लिया गया है, जिसमें दस्तावेज़ समझ, चित्र विवरण आदि कई क्षेत्रों की सामग्री शामिल है, जिससे इसकी व्यापक अनुप्रयोग क्षमता है। वर्तमान में यह मॉडल Hugging Face प्लेटफ़ॉर्म पर मुफ़्त में उपलब्ध है, जिसका उद्देश्य डेवलपर्स और शोधकर्ताओं को शक्तिशाली बहुविधा प्रसंस्करण क्षमता प्रदान करना है।
SmolVLM-256M-निर्देश नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
29742941
बाउंस दर
44.20%
प्रति विज़िट औसत पृष्ठ
5.9
औसत विज़िट अवधि
00:04:44