Meta AI के शोधकर्ता थॉमस सियालोम ने हाल ही में एक साक्षात्कार में उनके नवीनतम प्रोजेक्ट Llama3 के बारे में कुछ अंतर्दृष्टियाँ साझा कीं। उन्होंने स्पष्ट रूप से बताया कि इंटरनेट पर उपलब्ध बहुत से पाठ्य सामग्री की गुणवत्ता असमान है, और उनका मानना है कि इन डेटा पर प्रशिक्षण देना संसाधनों की बर्बादी है। इसलिए, Llama3 के प्रशिक्षण के दौरान उन्होंने किसी भी मानव-लिखित उत्तर पर निर्भर नहीं किया, बल्कि पूरी तरह से Llama2 द्वारा उत्पन्न संश्लेषित डेटा पर आधारित रहे।
Llama3 के प्रशिक्षण विवरण पर चर्चा करते हुए, सियालोम ने विभिन्न क्षेत्रों में संश्लेषित डेटा के अनुप्रयोगों के बारे में विस्तार से बताया। उदाहरण के लिए, कोड जनरेशन के क्षेत्र में, उन्होंने संश्लेषित डेटा उत्पन्न करने के लिए तीन विभिन्न विधियों का उपयोग किया, जिसमें कोड निष्पादन की प्रतिक्रिया, प्रोग्रामिंग भाषाओं का अनुवाद और दस्तावेजों का उल्टा अनुवाद शामिल है। गणितीय तर्क के क्षेत्र में, उन्होंने डेटा उत्पन्न करने के लिए "आइए हम धीरे-धीरे सत्यापित करें" शोध विधि का सहारा लिया। इसके अतिरिक्त, Llama3 ने 90% बहुभाषी टोकन के माध्यम से आगे की पूर्व-प्रशिक्षण किया, ताकि उच्च गुणवत्ता की मानव टिप्पणियाँ एकत्र की जा सकें, जो बहुभाषी प्रोसेसिंग में विशेष रूप से महत्वपूर्ण हैं।
लंबे पाठों की प्रक्रिया भी Llama3 का एक प्रमुख ध्यान है, जहाँ उन्होंने लंबे पाठ के प्रश्नोत्तर, लंबे दस्तावेजों का सारांश और कोड भंडार की तर्क के लिए संश्लेषित डेटा पर निर्भर किया। उपकरणों के उपयोग के मामले में, Llama3 ने एकल, नेस्टेड, समांतर और बहु-चरण फ़ंक्शन कॉल के लिए ब्रेव सर्च, वोल्फ्राम अल्फा और पायथन इंटरप्रेटर पर प्रशिक्षण दिया।
सियालोम ने Llama3 के प्रशिक्षण में मानव प्रतिक्रिया के साथ सुदृढीकरण सीखने (RLHF) के महत्व का भी उल्लेख किया। उन्होंने मॉडल को प्रशिक्षित करने के लिए मानव प्राथमिकता डेटा का व्यापक रूप से उपयोग किया और मानवों की चयन करने की क्षमता (जैसे, दो कविताओं में से एक को पसंद करने के लिए) पर जोर दिया, न कि शून्य से रचना करने पर।
Meta ने जून में Llama4 के प्रशिक्षण की शुरुआत की है, सियालोम ने खुलासा किया कि Llama4 का एक प्रमुख ध्यान एजेंटों के चारों ओर होगा। इसके अलावा, उन्होंने Llama के बहु-मोडल संस्करण का भी उल्लेख किया, जिसमें अधिक पैरामीटर होंगे और इसे निकट भविष्य में जारी करने की योजना है।
सियालोम का साक्षात्कार Meta AI के कृत्रिम बुद्धिमत्ता क्षेत्र में नवीनतम प्रगति और भविष्य की विकास दिशा को उजागर करता है, विशेष रूप से यह दर्शाते हुए कि कैसे संश्लेषित डेटा और मानव प्रतिक्रिया का उपयोग करके मॉडल के प्रदर्शन को बढ़ाया जा सकता है।