WeST
300 पंक्तियों के कोड का उपयोग करके LLM-आधारित ध्वनि-से-पाठ रूपांतरण।
सामान्य उत्पादप्रोग्रामिंगध्वनि पहचानप्राकृतिक भाषा संसाधन
WeST एक ओपन-सोर्स ध्वनि पहचान और ट्रांसक्रिप्शन मॉडल है जो बड़े भाषा मॉडल (LLM) के आधार पर, केवल 300 पंक्तियों कोड में ध्वनि से पाठ रूपांतरण को लागू करता है। इसमें एक बड़ा भाषा मॉडल, एक ध्वनि एन्कोडर और एक प्रोजेक्टर शामिल है, जिसमें केवल प्रोजेक्टर भाग प्रशिक्षित किया जा सकता है। WeST की अवधारणा SLAM-ASR और LLaMA 3.1 से प्रेरित है, जिसका उद्देश्य सरलीकृत कोड के माध्यम से कुशल ध्वनि पहचान कार्यक्षमता प्रदान करना है।
WeST नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
474564576
बाउंस दर
36.20%
प्रति विज़िट औसत पृष्ठ
6.1
औसत विज़िट अवधि
00:06:34