अल्ट्रावाक्स-v0_4_1-लामा-3_1-8b
बहुआयामी ध्वनि बृहत् भाषा मॉडल
सामान्य उत्पादउत्पादकताध्वनि पहचानध्वनि अनुवाद
fixie-ai/ultravox-v0_4_1-llama-3_1-8b एक पूर्व-प्रशिक्षित Llama3.1-8B-Instruct और whisper-large-v3-turbo पर आधारित बृहत् भाषा मॉडल है, जो ध्वनि और पाठ इनपुट को संभाल सकता है और पाठ आउटपुट उत्पन्न कर सकता है। यह मॉडल विशेष <|audio|> छद्म टोकन का उपयोग करके इनपुट ऑडियो को एम्बेडिंग में परिवर्तित करता है और आउटपुट टेक्स्ट उत्पन्न करता है। भविष्य के संस्करणों में सिमेंटिक और ध्वनिक ऑडियो टोकन उत्पन्न करने के लिए टोकन शब्दावली का विस्तार करने की योजना है, जिससे बाद में ध्वनि संकेतक द्वारा भाषण आउटपुट उत्पन्न किया जा सकता है। यह मॉडल अनुवाद मूल्यांकन में उत्कृष्ट प्रदर्शन करता है और इसमें कोई पक्षपात नहीं है, यह ध्वनि एजेंट, ध्वनि से ध्वनि अनुवाद, ध्वनि विश्लेषण आदि जैसे परिदृश्यों के लिए उपयुक्त है।
अल्ट्रावाक्स-v0_4_1-लामा-3_1-8b नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
29742941
बाउंस दर
44.20%
प्रति विज़िट औसत पृष्ठ
5.9
औसत विज़िट अवधि
00:04:44