आर्टिफिशियल इंटेलिजेंस कंपनी एंथ्रोपिक ने क्लॉड 3.5 श्रृंखला मॉडल के महत्वपूर्ण अपग्रेड की घोषणा की है, जिसमें नए क्लॉड 3.5 सोननेट और क्लॉड 3.5 हाइकू शामिल हैं। अपग्रेड किए गए संस्करण का दावा है कि यह आर्टिफिशियल इंटेलिजेंस को आपके व्यक्तिगत कंप्यूटर पर पूरी तरह से नियंत्रण करने की अनुमति देता है, यह विभिन्न मूलभूत कार्यों को निष्पादित कर सकता है, जैसे कि कीबोर्ड इनपुट और माउस क्लिक का अनुकरण करना, जिससे यह आपके कंप्यूटर पर स्थापित किसी भी एप्लिकेशन का उपयोग कर सके।
कोडिंग क्षमता में महत्वपूर्ण सुधार, OpenAI o1-preview मॉडल से आगे
नया क्लॉड 3.5 सोननेट सभी पहलुओं में महत्वपूर्ण सुधार के साथ आया है, विशेष रूप से कोडिंग क्षमता में। इसका SWE-bench Verified पर स्कोर 33.4% से बढ़कर 49.0% हो गया है, जो सभी सार्वजनिक रूप से उपलब्ध मॉडलों को पार कर गया है, जिसमें OpenAI का o1-preview मॉडल भी शामिल है।
इसके अलावा, TAU-bench पर इसके प्रदर्शन में भी सुधार हुआ है, विशेष रूप से खुदरा और विमानन क्षेत्रों में। यह सब पिछले उत्पाद के समान मूल्य और गति को बनाए रखते हुए हासिल किया गया है।
ग्राहकों की प्रतिक्रिया से पता चलता है कि अपग्रेड किए गए क्लॉड 3.5 सोननेट ने एआई कोडिंग में गुणात्मक छलांग लगाई है। उदाहरण के लिए, गिटलेब ने इस मॉडल का उपयोग DevSecOps कार्यों के लिए परीक्षण किया, और पाया कि इसकी तर्क क्षमता में स्पष्ट सुधार हुआ है, और इसमें कोई देरी नहीं बढ़ी।
क्लॉड 3.5 हाइकू क्लॉड की अगली पीढ़ी का सबसे तेज़ मॉडल है, जो समान लागत और गति में क्लॉड 3 ओपस को पार करता है और कई बुद्धिमान बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करता है, विशेष रूप से कोडिंग कार्यों में। क्लॉड 3.5 हाइकू की कम विलंबता और अधिक सटीक निर्देश पालन क्षमता इसे उपयोगकर्ता इंटरफेस उत्पादों और व्यक्तिगत अनुभवों के निर्माण के लिए बहुत उपयुक्त बनाती है।
मनुष्यों की तरह कंप्यूटर का संचालन
नया कंप्यूटर उपयोग कार्यक्षमता एक नई कोशिश है। अधिकारियों का कहना है कि यह क्लॉड के लिए विशेष उपकरण विकसित करने के लिए नहीं है, बल्कि इसे सामान्य कंप्यूटर कौशल सिखाने के लिए है, ताकि यह विभिन्न मानक उपकरणों और सॉफ्टवेयर प्रोग्रामों का उपयोग कर सके। डेवलपर्स इस क्षमता का उपयोग दोहराए जाने वाले प्रक्रियाओं को स्वचालित करने, सॉफ्टवेयर का निर्माण और परीक्षण करने, और ओपन-एंडेड अनुसंधान करने के लिए कर सकते हैं।
बेशक, वर्तमान में क्लॉड की कंप्यूटर उपयोग करने की क्षमता अभी भी सुधार की आवश्यकता है। कुछ सरल कार्य, जैसे स्क्रॉलिंग और ड्रैगिंग, अभी भी क्लॉड के लिए चुनौतीपूर्ण हैं। सुरक्षा सुनिश्चित करने के लिए, अधिकारियों ने एक नया वर्गीकरणकर्ता विकसित किया है, जो पहचान सकता है कि क्या कंप्यूटर का उपयोग संभावित हानि का कारण बन रहा है।
एंथ्रोपिक के मुख्य वैज्ञानिक अधिकारी जारेड कैपलान ने एक साक्षात्कार में कहा: “हम एक नए युग में प्रवेश करने जा रहे हैं, जहां आर्टिफिशियल इंटेलिजेंस आपके व्यक्तिगत रूप से उपयोग किए जाने वाले सभी उपकरणों का उपयोग करके कार्यों को पूरा कर सकता है।” यह अपडेट एंथ्रोपिक के लिए पारंपरिक चैट फ्रेमवर्क से व्यावसायिक एआई मॉडल को व्यापक “एआई एजेंट” में विस्तारित करने के लिए एक महत्वपूर्ण कदम है।
एक डेमो में, क्लॉड से कहा गया कि वह अपने दोस्त के लिए गोल्डन गेट ब्रिज पर सूर्योदय देखने की यात्रा की योजना बनाए। एआई ने न केवल वेबपेज खोला, बल्कि गूगल पर एक उपयुक्त दृश्य स्थल भी खोजा और यात्रा कार्यक्रम को कैलेंडर एप्लिकेशन में जोड़ा। हालांकि यह प्रदर्शन प्रभावशाली था, लेकिन 'कनेक्ट' ने बताया कि यह कुछ अतिरिक्त जानकारी प्रदान नहीं करता, जैसे कि गंतव्य तक कैसे पहुँचना है।
इसके अलावा, एक अन्य डेमो में, क्लॉड से कहा गया कि वह एक साधारण वेबसाइट बनाए। परिणामस्वरूप, इसने माइक्रोसॉफ्ट के विजुअल स्टूडियो कोड का उपयोग करके एक वेबसाइट सफलतापूर्वक बनाई और परीक्षण के लिए स्थानीय सर्वर खोला। हालाँकि, इस प्रक्रिया में, इसे कुछ छोटी गलतियों का सामना करना पड़ा, लेकिन संकेत मिलने पर इसने कोड को सफलतापूर्वक ठीक किया।
क्लॉड 3.5 सोननेट ने ग्राहक संबंध प्रबंधन प्रणाली (CRM) से आवश्यक जानकारी को पुनः प्राप्त करके, स्वायत्त रूप से एक विक्रेता आवेदन पत्र पूरा किया, जो विभिन्न सॉफ़्टवेयर प्लेटफ़ॉर्म पर कई चरणों के कार्यों को निष्पादित करने की क्षमता को प्रदर्शित करता है।
अपग्रेड किया गया क्लॉड 3.5 सोननेट अब सभी उपयोगकर्ताओं के लिए उपलब्ध है। आज से, डेवलपर्स एंथ्रोपिक एपीआई, अमेज़न बेडरॉक और गूगल क्लाउड के वर्टेक्स एआई पर कंप्यूटर बीटा संस्करण का उपयोग करके निर्माण कर सकते हैं। जबकि नया क्लॉड 3.5 हाइकू इस महीने के अंत में जारी किया जाएगा।
आधिकारिक ब्लॉग: https://www.anthropic.com/news/3-5-models-and-computer-use
मुख्य बिंदु:
🌟 क्लॉड 3.5 सोननेट और हाइकू मॉडल का महत्वपूर्ण अपग्रेड, कोडिंग क्षमता में महत्वपूर्ण सुधार।
💻 नए कंप्यूटर उपयोग कार्यक्षमता क्लॉड को मनुष्य की तरह कंप्यूटर संचालित करने की अनुमति देती है, जिससे अधिक संभावनाएँ खुलती हैं।
🔒 एआई सहायक का उपयोग सुरक्षा जोखिम लाता है, एंथ्रोपिक ने सुरक्षा सुनिश्चित करने के लिए धीरे-धीरे अवलोकन और सुधार पर जोर दिया है।