आर्टिफिशियल इंटेलिजेंस स्टार्टअप HyperWrite के CEO Matt Shumer ने एक महत्वपूर्ण मील का पत्थर घोषित किया: उन्होंने Meta के ओपन-सोर्स Llama3.1-70B Instruct पर आधारित Reflection70B मॉडल लॉन्च किया है। यह नया मॉडल न केवल तीसरे पक्ष के बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करता है, बल्कि इसे "दुनिया का सबसे शक्तिशाली ओपन-सोर्स AI मॉडल" भी कहा गया है।

Shumer ने सोशल नेटवर्क X पर इस खबर को साझा किया और दिखाया कि Reflection70B ने कई परीक्षणों में Meta Llama श्रृंखला को कैसे पार किया, इसकी प्रदर्शन चार्ट के साथ, जो शीर्ष व्यावसायिक मॉडल के साथ भी प्रतिस्पर्धा कर सकता है। जैसे ही यह खबर आई, HyperWrite के डेमो वेबसाइट पर विज़िट की संख्या में अचानक वृद्धि हुई, और टीम वर्तमान में उपयोगकर्ता की मांगों को पूरा करने के लिए अधिक GPU संसाधनों की तलाश कर रही है।

image.png

Reflection70B की अनोखी विशेषता इसकी आत्म-समर्पण तकनीक है। Shumer ने बताया कि मौजूदा बड़े भाषा मॉडल (LLM) गलतियाँ कर सकते हैं, लेकिन अक्सर आत्म-सुधार की क्षमता की कमी होती है। Reflection70B टेक्स्ट जनरेट करने के बाद उसकी सटीकता की समीक्षा और मूल्यांकन करके उपयोगकर्ताओं को प्रदान किए गए उत्तरों की विश्वसनीयता सुनिश्चित करता है।

इस मॉडल ने कुछ नए विशेष प्रतीकों को पेश किया है, जिससे उपयोगकर्ता मॉडल के साथ अधिक संरचित तरीके से इंटरैक्ट कर सकते हैं। अनुमान प्रक्रिया के दौरान, मॉडल विशेष टैग के भीतर अपनी अनुमान प्रक्रिया को आउटपुट करता है, जिससे वास्तविक समय में गलतियों को ठीक किया जा सकता है। डेमो वेबसाइट पर, उपयोगकर्ता सरल प्रश्न पूछने का प्रयास कर सकते हैं, जैसे "‘Strawberry’ शब्द में कितने अक्षर 'r' हैं?" या "9.11 और 9.9 में से कौन सा संख्या बड़ी है?" आदि, Reflection70B एक निश्चित समय के बाद सही उत्तर देने में सक्षम है।

Reflection70B की यह विशेषता इसे उच्च सटीकता वाले कार्यों के लिए बहुत उपयुक्त बनाती है। यह अनुमान प्रक्रिया को कुछ स्पष्ट चरणों में विभाजित करके परिणामों की सटीकता को बढ़ाता है। अब, Reflection70B को AI कोड लाइब्रेरी Hugging Face के माध्यम से डाउनलोड किया जा सकता है, और API कनेक्शन जल्द ही GPU सेवा प्रदाता Hyperbolic Labs द्वारा लॉन्च किया जाएगा।

इसके अलावा, HyperWrite अपने मुख्य AI लेखन सहायक उत्पाद में Reflection70B मॉडल को एकीकृत करने के लिए प्रयासरत है, और अगले सप्ताह एक और मजबूत संस्करण - Reflection405B जारी करने की उम्मीद है। Shumer ने खुलासा किया कि वे इस तकनीक को वास्तविक उत्पादों में बेहतर तरीके से लागू करने के तरीकों की खोज कर रहे हैं।

Reflection70B की सफलता में Glaive कंपनी का योगदान भी महत्वपूर्ण है। Glaive विशेष उपयोग के मामलों के लिए डेटा सेट उत्पन्न करने पर ध्यान केंद्रित करता है, जिससे मॉडल के प्रशिक्षण में तेजी आती है। Glaive का प्लेटफॉर्म उच्च गुणवत्ता वाले संश्लेषित डेटा को तेजी से उत्पन्न कर सकता है, जिससे कंपनियों को मॉडल को तेजी से और आर्थिक रूप से ट्यून करने में मदद मिलती है, और AI विकास में उच्च गुणवत्ता, कार्य विशेष डेटा की उपलब्धता की प्रमुख बाधाओं को हल करता है।

HyperWrite, जो लांग आईलैंड में स्थित एक AI स्टार्टअप है, 2020 में Shumer और Jason Kuperberg द्वारा स्थापित होने के बाद से AI क्षेत्र में सक्रिय रूप से खोज कर रहा है। यह पहले एक Chrome एक्सटेंशन के रूप में शुरू हुआ, और फिर अधिक जटिल कार्यों को संभालने वाले AI सहायक में विकसित हुआ, जिसके पास 20 लाख उपयोगकर्ताओं का बड़ा आधार है, और इसे Forbes की वार्षिक "30Under30" सूची में सम्मानित किया गया है।

HyperWrite की हालिया वित्तपोषण दौर मार्च 2023 में सामने आया, जिसमें 2.8 मिलियन डॉलर का फंडिंग मिला, जिसमें निवेशकों में Madrona Venture Group शामिल है। ये फंडिंग HyperWrite को नए AI संचालित सुविधाओं को लॉन्च करने में सहायता करता है, जो वेब ब्राउज़र को वर्चुअल सहायक में बदलता है, जो विभिन्न कार्यों को पूरा कर सकता है, जैसे कि फ्लाइट बुकिंग से लेकर LinkedIn पर नौकरी के आवेदकों की खोज करना।

Shumer ने जोर दिया कि सटीकता और सुरक्षा हमेशा HyperWrite की प्राथमिकता रहे हैं, विशेष रूप से जटिल स्वचालन कार्यों की खोज करते समय। यह प्लेटफॉर्म लगातार उपयोगकर्ता फीडबैक के माध्यम से निगरानी और सुधार कर रहा है, ताकि इसके व्यक्तिगत सहायक उपकरण को बेहतर बनाया जा सके। यह सावधानीपूर्वक दृष्टिकोण, जैसे कि Reflection70B में शामिल संरचित अनुमान और आत्म-चिंतन, Shumer की सटीकता और जिम्मेदारी के प्रति प्रतिबद्धता को दर्शाता है।

मॉडल डाउनलोड लिंक: https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B