फ़िश एजेंट V0.1 3B
उच्च-परिशुद्धता पर्यावरणीय ऑडियो जानकारी कैप्चर और उत्पन्न करने वाला एक वॉइस-टू-वॉइस मॉडल
सामान्य उत्पादउत्पादकतावॉइस-टू-वॉइसटेक्स्ट-टू-स्पीच
फ़िश एजेंट V0.1 3B एक अभूतपूर्व वॉइस-टू-वॉइस मॉडल है जो अभूतपूर्व सटीकता के साथ पर्यावरणीय ऑडियो जानकारी को कैप्चर और उत्पन्न कर सकता है। यह मॉडल एक बिना किसी अर्थपूर्ण लेबलिंग वाले आर्किटेक्चर का उपयोग करता है, जिससे पारंपरिक अर्थपूर्ण एन्कोडर/डिकोडर की आवश्यकता समाप्त हो जाती है। इसके अतिरिक्त, यह एक अत्याधुनिक टेक्स्ट-टू-स्पीच (TTS) मॉडल भी है, जिसे 700,000 घंटे की बहुभाषी ऑडियो सामग्री पर प्रशिक्षित किया गया है। Qwen-2.5-3B-Instruct के आगे के प्रशिक्षण संस्करण के रूप में, इसे 200B वॉइस और टेक्स्ट टोकन पर प्रशिक्षित किया गया है। यह मॉडल 8 भाषाओं का समर्थन करता है, जिनमें अंग्रेजी और चीनी शामिल हैं, प्रत्येक भाषा के लिए प्रशिक्षण डेटा की मात्रा अलग-अलग है, जिसमें अंग्रेजी और चीनी में लगभग 300,000 घंटे और अन्य भाषाओं में लगभग 20,000 घंटे हैं।
फ़िश एजेंट V0.1 3B नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
29742941
बाउंस दर
44.20%
प्रति विज़िट औसत पृष्ठ
5.9
औसत विज़िट अवधि
00:04:44