मॉड कम्युनिटी ने OneLLM नामक एक मल्टी-मोडल संरेखण एकीकृत ढांचा ओपन-सोर्स किया है। यह ढांचा सामान्य एन्कोडर और एकीकृत प्रक्षिप्ति मॉड्यूल का उपयोग करके LLM के साथ मल्टी-मोडल इनपुट को संरेखित करता है। यह चित्र, ऑडियो, वीडियो आदि कई प्रकार के मोड डेटा की समझ का समर्थन करता है, और वीडियो - टेक्स्ट, ऑडियो - वीडियो - टेक्स्ट जैसे कार्यों में मजबूत ज़ीरो-शॉट क्षमताएँ प्रदर्शित करता है। OneLLM का ओपन-सोर्स कोड GitHub पर प्रकाशित किया गया है, जहां इस प्लेटफ़ॉर्म पर संबंधित मॉडल वजन और मॉडल निर्माण स्थान प्राप्त किया जा सकता है।
मोद डॉट कॉम्युनिटी ओपन-सोर्स मल्टी-मोडल एलाइनमेंट यूनिफाइड फ्रेमवर्क OneLLM

站长之家
51
© सर्वाधिकार सुरक्षित AIbase बेस 2024, स्रोत देखने के लिए क्लिक करें - https://www.aibase.com/in/news/4430