क्या एआई आखिरकार सोचने लगा है? एमआईटी के विशेषज्ञ ने बड़े मॉडल में 'मानव मस्तिष्क के क्षेत्रों' की खोज की!

AIbase基地

द्वारा प्रकाशितAI समाचार · 4 मिनट पढ़ें · Oct 30, 2024

255

क्या AI वास्तव में "दिमाग" विकसित कर रहा है?! मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी के नवीनतम शोध से पता चलता है कि बड़े भाषा मॉडल (LLM) की आंतरिक संरचना, मानव मस्तिष्क के साथ आश्चर्यजनक समानताएँ रखती है!

इस अध्ययन नेSparse Autoencoder तकनीक का उपयोग करके LLM के सक्रियण स्थान का गहन विश्लेषण किया, और तीन स्तरों की संरचनात्मक विशेषताओं की खोज की, जो चकित करने वाली हैं:

पहले, सूक्ष्म स्तर पर, शोधकर्ताओं ने "क्रिस्टल" जैसी संरचनाओं की उपस्थिति पाई। ये "क्रिस्टल" के चेहरे समांतर चतुर्भुज या ट्रैपेज़ियम से बने होते हैं, जो हमारे परिचित शब्दों के उपमा जैसे "पुरुष:महिला::राजा:रानी" के समान होते हैं।

और भी आश्चर्यजनक बात यह है कि, कुछ अप्रासंगिक अवरोधों (जैसे शब्दों की लंबाई) को हटाने के लिए रैखिक विभेदन विश्लेषण तकनीक का उपयोग करने के बाद, ये "क्रिस्टल" संरचनाएँ और भी स्पष्ट हो जाती हैं।

दूसरे, मध्य स्तर पर, शोधकर्ताओं ने पाया कि LLM के सक्रियण स्थान में मानव मस्तिष्क के कार्यात्मक विभाजन के समान एक मॉड्यूलर संरचना है।

उदाहरण के लिए, गणित और कोड से संबंधित विशेषताएँ एक साथ एकत्रित होती हैं, जो मानव मस्तिष्क के कार्यात्मक लोब के समान एक "मस्तिष्क लोब" बनाती हैं। विभिन्न मापदंडों के माध्यम से मात्रात्मक विश्लेषण करके, शोधकर्ताओं ने इन "मस्तिष्क लोब" की स्थानिक स्थानीयता की पुष्टि की, जो दर्शाती है कि जो विशेषताएँ एक साथ प्रकट होती हैं, वे स्थानिक रूप से अधिक एकत्रित होती हैं, जो यादृच्छिक वितरण की अपेक्षाओं से बहुत अधिक होती हैं।

सूक्ष्म स्तर पर, शोधकर्ताओं ने पाया कि LLM विशेषता बिंदु बादल की समग्र संरचना समदिशीय नहीं है, बल्कि यह एक शक्ति नियम विशेषता मान वितरण प्रस्तुत करती है, और यह वितरण मध्य स्तर पर सबसे स्पष्ट है।

शोधकर्ताओं ने विभिन्न स्तरों की क्लस्टर एंट्रॉपी का मात्रात्मक विश्लेषण भी किया, और पाया कि मध्य स्तर की क्लस्टर एंट्रॉपी कम है, जो दर्शाती है कि विशेषता प्रस्तुति अधिक केंद्रित है, जबकि प्रारंभिक और अंतिम स्तर की क्लस्टर एंट्रॉपी अधिक है, जो दर्शाती है कि विशेषता प्रस्तुति अधिक वितरित है।

यह अध्ययन हमें बड़े भाषा मॉडल की आंतरिक तंत्र को समझने के लिए एक नई दृष्टिकोण प्रदान करता है, और भविष्य में अधिक शक्तिशाली और बुद्धिमान AI सिस्टम विकसित करने के लिए आधार तैयार करता है।

बायोमेडिकल अनुसंधान में सहायता करने वाला ओपन-सोर्स फ़्रेमवर्क BioChatter, LLM के उपयोग की बाधाओं को कम करता है

BioChatter एक ओपन-सोर्स फ़्रेमवर्क है जो बायोमेडिकल अनुसंधान को आसान बनाने के लिए डिज़ाइन किया गया है। यह बड़े भाषा मॉडल (LLM) के उपयोग की बाधाओं को कम करके शोधकर्ताओं को जटिल डेटा से अंतर्दृष्टि निकालने में मदद करता है।

सुरक्षा खतरों से सावधान रहें! Ollama बड़े भाषा मॉडल उपकरण में गंभीर कमियाँ पाई गईं

हाल ही में, ओल्लामा नामक एक लोकप्रिय बड़े भाषा मॉडल उपकरण में गंभीर सुरक्षा कमियाँ पाई गई हैं। इन कमियों का शोषण करके दुर्भावनापूर्ण अभिनेता संवेदनशील डेटा तक पहुँच प्राप्त कर सकते हैं और सिस्टम को नुकसान पहुँचा सकते हैं। उपयोगकर्ताओं को सलाह दी जाती है कि वे अपने सिस्टम को अपडेट करें और सुरक्षा सावधानियों का पालन करें।

एलेक्सा का व्यापक उन्नयन: बड़े भाषा मॉडल के साथ एकीकरण और AI सहायक परिदृश्य में बदलाव

एलेक्सा में एक बड़ा अपडेट आया है जिसमें बड़े भाषा मॉडल को जोड़ा गया है जिससे AI सहायकों के क्षेत्र में एक नया मुकाम हासिल हुआ है। यह अपडेट एलेक्सा की क्षमताओं को बढ़ाता है और उपयोगकर्ताओं को बेहतर अनुभव प्रदान करता है।

स्टैनफोर्ड का नया एआई ढांचा OctoTools: बिना प्रशिक्षण के, एआई को कुशल जटिल तर्क करने दें!

कृत्रिम बुद्धिमत्ता (एआई) के क्षेत्र में, हालाँकि बड़े भाषा मॉडल (LLMs) प्राकृतिक भाषा को संभालने में उत्कृष्ट प्रदर्शन करते हैं, लेकिन जब जटिल तर्क कार्यों का सामना करना पड़ता है, तो वे अक्सर असमर्थ हो जाते हैं। ये कार्य आमतौर पर बहु-चरणीय तर्क, क्षेत्र विशेष का ज्ञान, या बाहरी उपकरणों के प्रभावी एकीकरण की आवश्यकता होती है। इन सीमाओं को पार करने के लिए, शोधकर्ता यह पता लगाने की कोशिश कर रहे हैं कि कैसे बाहरी उपकरणों का उपयोग LLM की क्षमताओं को बढ़ाया जा सकता है। पारंपरिक संवर्धन विधियाँ आमतौर पर मॉडल को फिर से ठीक करने या अतिरिक्त प्रशिक्षण की आवश्यकता होती हैं, जिससे इसके कार्य अनुकूलन और लचीलेपन पर प्रभाव पड़ता है।

AI समाचार

क्या एआई आखिरकार सोचने लगा है? एमआईटी के विशेषज्ञ ने बड़े मॉडल में 'मानव मस्तिष्क के क्षेत्रों' की खोज की!

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

बायोमेडिकल अनुसंधान में सहायता करने वाला ओपन-सोर्स फ़्रेमवर्क BioChatter, LLM के उपयोग की बाधाओं को कम करता है

सुरक्षा खतरों से सावधान रहें! Ollama बड़े भाषा मॉडल उपकरण में गंभीर कमियाँ पाई गईं

एलेक्सा का व्यापक उन्नयन: बड़े भाषा मॉडल के साथ एकीकरण और AI सहायक परिदृश्य में बदलाव

स्टैनफोर्ड का नया एआई ढांचा OctoTools: बिना प्रशिक्षण के, एआई को कुशल जटिल तर्क करने दें!