संयुक्त राज्य अमेरिका के सैन फ्रांसिस्को में स्थित AI स्टार्टअप Cosine ने एक नया AI मॉडल पेश किया है जिसे Genie कहा जाता है, जो सॉफ़्टवेयर डेवलपर्स की सहायता के लिए डिज़ाइन किया गया है। कंपनी के अनुसार, Genie ने बेंचमार्क परीक्षणों में प्रतिस्पर्धियों को पीछे छोड़ दिया है और असाधारण क्षमताओं का प्रदर्शन किया है।
Cosine ने OpenAI के साथ मिलकर उच्च गुणवत्ता वाले डेटा का उपयोग करके GPT-4o वेरिएंट को प्रशिक्षित किया है, जिससे ध्यान देने योग्य बेंचमार्क परिणाम प्राप्त हुए हैं। कंपनी का कहना है कि Genie की सफलता की कुंजी इसकी "मानव तर्क को कोड करने" की क्षमता है, जो संभवतः सॉफ़्टवेयर विकास के क्षेत्र से परे हो सकती है।
Genie ने SWE क्षेत्र में अग्रणी स्थान हासिल किया
Cosine के सह-संस्थापक और CEO Alistair Pullen ने बताया कि Genie ने SWE-Bench परीक्षण में 30% का स्कोर प्राप्त किया है, जो इस क्षेत्र में AI मॉडल द्वारा अब तक का सबसे उच्च स्कोर है। यह स्कोर अन्य कोडिंग पर केंद्रित भाषा मॉडल, जैसे कि Amazon का मॉडल (19%) और Cognition का Devin (SWE-Bench के कुछ परीक्षणों में 13.8%) को पीछे छोड़ता है।
Genie की संरचना मानव डेवलपर्स की संज्ञानात्मक प्रक्रिया का अनुकरण करने के लिए डिज़ाइन की गई है, यह स्वायत्त या सहयोगात्मक रूप से त्रुटियों को ठीक कर सकती है, नई सुविधाएँ विकसित कर सकती है, कोड को पुनर्गठन कर सकती है, और विभिन्न प्रोग्रामिंग कार्यों को निष्पादित कर सकती है।
संश्लेषित डेटा के माध्यम से आत्म-सुधार
Genie के विकास प्रक्रिया में एक विशेष प्रक्रिया का उपयोग किया गया, जिसमें अरबों उच्च गुणवत्ता वाले डेटा का उपयोग करके एक निजी GPT-40 वेरिएंट को प्रशिक्षित और माइक्रो-ट्यून किया गया। Cosine ने अनुभवी डेवलपर्स की मदद से इन डेटा को संकलित करने में लगभग एक साल बिताया, जिसमें 21% JavaScript और Python, 14% TypeScript और TSX, और 3% अन्य भाषाएँ (जैसे Java, C++ और Ruby) शामिल थीं।
Genie की उत्कृष्टता आंशिक रूप से इसके आत्म-सुधार प्रशिक्षण के कारण है। प्रारंभ में, यह मॉडल मुख्य रूप से सही और प्रभावी कोड से सीखता था, लेकिन अपनी त्रुटियों को संभालने में उलझन में था। Cosine ने इस समस्या को संश्लेषित डेटा का उपयोग करके हल किया: यदि Genie द्वारा प्रारंभ में प्रस्तुत समाधान गलत था, तो मॉडल को सही परिणामों के माध्यम से सुधारने का तरीका दिखाया गया। प्रत्येक पुनरावृत्ति के साथ, Genie के समाधान धीरे-धीरे बेहतर होते गए और आवश्यक सुधारों की संख्या भी कम होती गई।
तकनीकी सीमाओं को पार करना
Pullen ने 2022 की शुरुआत में ही बड़े भाषा मॉडल के मानव सॉफ़्टवेयर विकास का समर्थन करने की क्षमता को देखा था। हालाँकि, उस समय की तकनीक Genie के दृष्टिकोण को प्राप्त करने के स्तर पर नहीं थी। संदर्भ विंडो की टोकन क्षमता आमतौर पर 4000 टोकन तक सीमित होती है, जो एक प्रमुख बाधा है। आज, Gemini1.5Pro जैसे मॉडल एक बार में 20 लाख टोकन को संभाल सकते हैं। जबकि Cosine ने Genie की विशिष्ट टोकन क्षमता का खुलासा नहीं किया है, यह तकनीकी प्रगति निश्चित रूप से Genie की सफलता के लिए एक मजबूत आधार प्रदान करती है।