Resemble AI, एक प्रमुख वॉयस क्लोनिंग कंपनी, ने हाल ही में अपने अगले पीढ़ी के डीप फेक डिटेक्शन मॉडल Detect-2B की घोषणा की। यह नया मॉडल AI द्वारा उत्पन्न ऑडियो का पता लगाने में लगभग 94% उच्च सटीकता दिखाता है, जो डीप फेक डिटेक्शन तकनीक में एक और महत्वपूर्ण प्रगति को दर्शाता है।

Detect-2B एक श्रृंखला में पूर्व-प्रशिक्षित उप-मॉडल और फाइन-ट्यूनिंग तकनीकों का उपयोग करता है, ऑडियो क्लिप की गहन जांच करने के लिए यह निर्धारित करने के लिए कि क्या यह AI द्वारा उत्पन्न है। Resemble AI ने अपने ब्लॉग में कहा कि Detect-2B ने मौजूदा Detect मॉडल के आधार पर मॉडल आर्किटेक्चर, प्रशिक्षण डेटा और समग्र प्रदर्शन में महत्वपूर्ण छलांग लगाई है, जिससे एक अत्यंत मजबूत और सटीक डिटेक्शन मॉडल तैयार किया गया है।

Detect-2B के उप-मॉडल में एक फ्रीज किए गए ऑडियो प्रतिनिधित्व मॉडल और प्रमुख स्तरों को जोड़ने वाले अनुकूलन मॉड्यूल शामिल हैं। ये अनुकूलन मॉड्यूल मॉडल का ध्यान पिक्सेल पर केंद्रित करते हैं, यानी रिकॉर्डिंग में छोड़ी गई आकस्मिक आवाजें, जो आमतौर पर वास्तविक ऑडियो और AI द्वारा उत्पन्न ऑडियो के बीच अंतर कर सकती हैं। AI द्वारा उत्पन्न ऑडियो अक्सर "बहुत साफ" लगता है, जबकि Detect-2B ऑडियो के AI द्वारा उत्पन्न होने की संभावना का पूर्वानुमान कर सकता है, बिना हर नए क्लिप को सुनने पर मॉडल को फिर से प्रशिक्षित किए।

AI客服 AI语音

चित्र स्रोत टिप्पणी: चित्र AI द्वारा उत्पन्न, चित्र अधिकार सेवा प्रदाता Midjourney

Resemble AI ने यह भी उल्लेख किया कि Detect-2B की आर्किटेक्चर Mamba-SSM या स्टेट स्पेस मॉडल पर आधारित है, जो स्थिर डेटा या पुनरावृत्त पैटर्न पर निर्भर नहीं करते हैं, बल्कि विभिन्न चर पर प्रतिक्रिया करने के लिए यादृच्छिक या यादृच्छिक संभाव्यता मॉडल का उपयोग करते हैं। यह आर्किटेक्चर ऑडियो डिटेक्शन के लिए बहुत उपयुक्त है क्योंकि यह ऑडियो क्लिप में विभिन्न गतिशीलताओं को पकड़ सकता है, ऑडियो सिग्नल की स्थिति के अनुकूल हो सकता है, यहां तक कि रिकॉर्डिंग की गुणवत्ता खराब होने पर भी।

मॉडल के प्रदर्शन का मूल्यांकन करते समय, Resemble AI ने Detect-2B का व्यापक परीक्षण किया, जिसमें अज्ञात वक्ता, डीप फेक द्वारा उत्पन्न ऑडियो और विभिन्न भाषाएँ शामिल थीं। कंपनी ने कहा कि यह मॉडल कम से कम 93% सटीकता के साथ छह विभिन्न भाषाओं के डीप फेक ऑडियो का सही पता लगा सकता है।

Resemble AI ने अप्रैल में अपने AI वॉयस प्लेटफॉर्म Rapid Voice Cloning को लॉन्च किया। Detect-2B API के माध्यम से उपलब्ध होगा और विभिन्न अनुप्रयोगों में एकीकृत किया जा सकेगा, जिससे व्यवसायों को मजबूत डीप फेक डिटेक्शन उपकरण प्रदान किया जा सकेगा।

2024 में अमेरिका के राष्ट्रपति चुनावों के नजदीक आने के साथ, AI द्वारा उत्पन्न आवाज़ों या वीडियो की पहचान करना越来越 महत्वपूर्ण होता जा रहा है। AI आवाज़ें मतदाताओं को भटकाने और गलत जानकारी फैलाने को और भी आसान बना सकती हैं, जिससे ब्रांडों पर लोगों का विश्वास कमजोर हो सकता है। Detect-2B जैसे उपकरणों की मदद से इन फेक चीजों की पहचान और प्रमाणन किया जा सकता है, इससे पहले कि वे जनता के ज्ञान में आएं।

Resemble AI एकमात्र कंपनी नहीं है जो AI क्लोन का पता लगाने के लिए समर्पित है। McAfee ने जनवरी में AI ऑडियो का पता लगाने के लिए Project Mockingbird शुरू किया, जबकि Meta AI द्वारा उत्पन्न ऑडियो में वॉटरमार्क जोड़ने के तरीके पर काम कर रहा है।

Resemble AI ने कहा कि जैसे-जैसे जनरेटिव AI क्षमताएँ बढ़ती हैं, उनकी डिटेक्शन क्षमताएँ भी लगातार बढ़नी चाहिए। उन्होंने Detect-2B को और बेहतर बनाने के लिए कई रोमांचक अनुसंधान दिशाएँ निर्धारित की हैं, जो विशेष रूप से चरित्र सीखने, उन्नत मॉडल आर्किटेक्चर और डेटा विस्तार जैसे क्षेत्रों पर ध्यान केंद्रित करती हैं। यह दर्शाता है कि Resemble AI डीप फेक तकनीक की चुनौतियों का सामना करने के लिए निरंतर नवाचार के प्रति प्रतिबद्ध है।