fixie-ai/ultravox-v0_4_1-llama-3_1-70b एक पूर्व-प्रशिक्षित Llama3.1-70B-Instruct और whisper-large-v3-turbo पर आधारित बृहत् भाषा मॉडल है, जो ध्वनि और पाठ इनपुट को संसाधित करके पाठ आउटपुट उत्पन्न कर सकता है। यह मॉडल विशेष छद्म चिह्न <|audio|> का उपयोग करके इनपुट ऑडियो को एम्बेडिंग में परिवर्तित करता है, और उसे पाठ संकेत के साथ मिलाकर आउटपुट पाठ उत्पन्न करता है। अल्ट्रावाक्स का विकास ध्वनि पहचान और पाठ निर्माण के अनुप्रयोगों के दायरे का विस्तार करने के लिए किया गया है, जैसे ध्वनि एजेंट, ध्वनि से ध्वनि अनुवाद और मौखिक ऑडियो विश्लेषण। यह मॉडल MIT लाइसेंस का पालन करता है, और Fixie.ai द्वारा विकसित किया गया है।