आज के समय में, जब मस्तिष्क - मशीन इंटरफेस (BCI) प्रौद्योगिकी तेजी से विकसित हो रही है, Meta AI द्वारा हाल ही में लॉन्च किया गया Brain2Qwerty मॉडल इस क्षेत्र में नई आशा लेकर आया है। BCI का उद्देश्य उन लोगों को संचार के साधन प्रदान करना है जिनके पास भाषाई या मोटर विकार हैं, लेकिन पारंपरिक विधियाँ अक्सर आक्रामक सर्जरी की आवश्यकता होती हैं, जैसे इलेक्ट्रोड लगाना, जो न केवल चिकित्सा जोखिम उठाती हैं, बल्कि लंबे समय तक रखरखाव की भी आवश्यकता होती है। इसलिए, शोधकर्ता गैर-आक्रामक विकल्पों की खोज करने लगे, विशेष रूप से मस्तिष्क विद्युत गतिविधि (EEG) आधारित विधियों पर। हालाँकि, EEG तकनीक को सिग्नल के निम्न संकल्प का सामना करना पड़ता है, जो इसकी सटीकता को प्रभावित करता है।

मस्तिष्क मानव आर्टिफिशियल इंटेलिजेंस

छवि स्रोत नोट: छवि AI द्वारा उत्पन्न की गई, छवि लाइसेंस सेवा प्रदाता Midjourney

Brain2Qwerty का लॉन्च इस चुनौती का समाधान करने के लिए है। यह गहन अध्ययन मॉडल EEG या मस्तिष्क मैग्नेटिक रिसोनेंस इमेजिंग (MEG) के माध्यम से कैप्चर की गई मस्तिष्क गतिविधियों से प्रतिभागियों द्वारा दर्ज किए गए वाक्यों को डिकोड कर सकता है। अध्ययन में, प्रतिभागियों ने QWERTY कीबोर्ड पर क्षणिक स्मृति के वाक्य दर्ज किए, जबकि उनकी मस्तिष्क गतिविधि को वास्तविक समय में रिकॉर्ड किया गया। पहले की तरह, जहां बाहरी उत्तेजनाओं पर ध्यान केंद्रित करने या गति की कल्पना करने की आवश्यकता थी, Brain2Qwerty ने प्राकृतिक टाइपिंग आंदोलन का उपयोग किया, जो मस्तिष्क की तरंगों की व्याख्या करने का एक अधिक सहज तरीका प्रदान करता है।

Brain2Qwerty की संरचना तीन मुख्य मॉड्यूल में विभाजित है। सबसे पहले, एक कन्वोल्यूशन मॉड्यूल है, जो EEG या MEG सिग्नल से समय और स्थान की विशेषताओं को निकालता है। इसके बाद, एक ट्रांसफार्मर मॉड्यूल है, जो इनपुट अनुक्रम को प्रोसेस करता है, समझ और अभिव्यक्ति को अनुकूलित करता है। अंत में, एक भाषा मॉडल मॉड्यूल है, जो एक पूर्व-प्रशिक्षित चरित्र-स्तरीय भाषा मॉडल है, जिसका उपयोग डिकोडिंग परिणामों की सटीकता को सुधारने और बढ़ाने के लिए किया जाता है।

Brain2Qwerty के प्रदर्शन का मूल्यांकन करते समय, शोधकर्ताओं ने मानक के रूप में चरित्र त्रुटि दर (CER) का उपयोग किया। परिणाम दर्शाते हैं कि EEG आधारित डिकोडिंग CER 67% है, जो अपेक्षाकृत उच्च है; जबकि MEG का उपयोग करने से डिकोडिंग का प्रदर्शन स्पष्ट रूप से सुधर गया, CER 32% तक गिर गया। प्रयोग में, सबसे अच्छे प्रदर्शन करने वाले प्रतिभागियों ने 19% CER प्राप्त किया, जो इस मॉडल की आदर्श परिस्थितियों में क्षमता को दर्शाता है।

हालांकि Brain2Qwerty ने गैर-आक्रामक BCI क्षेत्र में सकारात्मक संभावनाएँ दिखाई हैं, लेकिन अभी भी कई चुनौतियों का सामना करना पड़ता है। सबसे पहले, वर्तमान मॉडल को पूर्ण वाक्यों को संसाधित करने की आवश्यकता है, न कि एक-एक कुंजी दबाकर वास्तविक समय में डिकोड करने की। दूसरे, जबकि MEG का प्रदर्शन EEG की तुलना में बेहतर है, इसकी उपकरणें अभी तक पोर्टेबल नहीं हैं और इसकी व्यापकता कम है। अंत में, यह अध्ययन मुख्य रूप से स्वस्थ प्रतिभागियों में किया गया था, भविष्य में इसे मोटर या भाषाई विकार वाले लोगों पर लागू करने की क्षमता पर गहराई से जांच की आवश्यकता है।

पत्र: https://ai.meta.com/research/publications/brain-to-text-decoding-a-non-invasive-approach-via-typing/

मुख्य बिंदु:

🧠 Meta AI द्वारा पेश किया गया Brain2Qwerty मॉडल EEG और MEG के माध्यम से टाइपिंग सामग्री को डिकोड कर सकता है, जो BCI प्रौद्योगिकी के लिए नई आशा लाता है।  

📊 शोध परिणाम दर्शाते हैं कि MEG के उपयोग से डिकोडिंग की चरित्र त्रुटि दर EEG की तुलना में स्पष्ट रूप से कम है, जबकि सर्वोत्तम प्रतिभागियों ने 19% CER प्राप्त किया।  

🔍 भविष्य की चुनौतियों में वास्तविक समय डिकोडिंग, MEG उपकरणों की उपलब्धता और विकलांग व्यक्तियों में उपयोग प्रभाव शामिल हैं।