कृत्रिम बुद्धिमत्ता के क्षेत्र में बढ़ती प्रतिस्पर्धा के बीच, गूगल ने हाल ही में Gemini2.0 Flash Thinking मॉडल लॉन्च करने की घोषणा की है। यह बहु-मोडल अनुमान मॉडल जटिल समस्याओं का समाधान करने की तेज और पारदर्शी क्षमता के साथ आता है। गूगल के सीईओ सुंदर पिचाई ने सोशल मीडिया X पर कहा: "यह हमारा अब तक का सबसे गहरा मॉडल है।"
डेवलपर दस्तावेज़ के अनुसार, Gemini2 के Flash Thinking में मूल संस्करण Gemini2.0 Flash मॉडल की तुलना में अधिक मजबूत अनुमान क्षमताएँ हैं। नया मॉडल 32,000 इनपुट टोकन (लगभग 50 से 60 पृष्ठ पाठ) का समर्थन करता है, और आउटपुट प्रतिक्रिया 8,000 टोकन तक पहुंच सकती है। गूगल ने अपने AI स्टूडियो के साइड पैनल में कहा है कि यह मॉडल "बहु-मोडल समझ, अनुमान" और "कोडिंग" के लिए विशेष रूप से उपयुक्त है।
डेवलपर दस्तावेज़: https://ai.google.dev/gemini-api/docs/thinking-mode?hl=zh-cn
हालांकि मॉडल के प्रशिक्षण प्रक्रिया, संरचना, लाइसेंस और लागत जैसे विवरण अभी तक जारी नहीं किए गए हैं, लेकिन गूगल AI स्टूडियो में दिखाया गया है कि वर्तमान में इस मॉडल का उपयोग करने की लागत प्रति टोकन शून्य है।
Gemini2.0 का एक प्रमुख विशेषता यह है कि यह उपयोगकर्ताओं को ड्रॉप-डाउन मेनू के माध्यम से मॉडल के चरण-दर-चरण अनुमान प्रक्रिया तक पहुंचने की अनुमति देता है, जो OpenAI के o1 और o1mini जैसे प्रतिस्पर्धी मॉडलों में उपलब्ध नहीं है। यह पारदर्शी अनुमान विधि उपयोगकर्ताओं को यह स्पष्ट रूप से समझने की अनुमति देती है कि मॉडल ने निष्कर्ष कैसे निकाले, जिससे AI को "ब्लैक बॉक्स" के रूप में देखने की समस्या का प्रभावी समाधान होता है।
कुछ सरल परीक्षणों में, Gemini2.0 कुछ जटिल प्रश्नों का तेज़ी से (एक से तीन सेकंड के भीतर) सही उत्तर देने में सक्षम रहा, जैसे कि "स्ट्रॉबेरी" शब्द में "R" अक्षर की संख्या की गणना करना। एक अन्य परीक्षण में, मॉडल ने समग्र संख्या और दशमलव स्थानों का चरण-दर-चरण विश्लेषण करके दो दशमलव (9.9 और 9.11) की तुलना की।
थर्ड-पार्टी स्वतंत्र विश्लेषण संस्थान LM Arena ने Gemini2.0 Flash Thinking मॉडल को सभी बड़े भाषा मॉडल श्रेणियों में सर्वश्रेष्ठ प्रदर्शन करने वाला मॉडल बताया है।
इसके अलावा, Gemini2.0 Flash Thinking मॉडल में मूल रूप से छवि अपलोड और विश्लेषण करने की क्षमता भी है। OpenAI के o1 की तुलना में, जो मूल रूप से एक पाठ मॉडल था और बाद में छवि और फ़ाइल विश्लेषण के विस्तार के साथ आया। वर्तमान में, दोनों केवल पाठ आउटपुट लौटाते हैं।
हालांकि Gemini2.0 Flash Thinking मॉडल की बहु-मोडल क्षमताएँ इसके संभावित अनुप्रयोग परिदृश्यों का विस्तार करती हैं, डेवलपर्स को ध्यान देना चाहिए कि वर्तमान में यह मॉडल गूगल सर्च के साथ संयोजन का समर्थन नहीं करता है और न ही इसे अन्य गूगल एप्लिकेशन और बाहरी उपकरणों के साथ एकीकृत किया जा सकता है। Google AI Studio और Vertex AI के माध्यम से, डेवलपर्स इस मॉडल पर प्रयोग कर सकते हैं।
प्रतिस्पर्धी AI बाजार में, Gemini2.0 Flash Thinking मॉडल समस्या समाधान मॉडल के एक नए युग का प्रतीक हो सकता है। विभिन्न डेटा प्रकारों को संसाधित करने, दृश्य अनुमान प्रदान करने और बड़े पैमाने पर संचालन की क्षमता के साथ, यह अनुमान AI बाजार में OpenAI o1 श्रृंखला और अन्य मॉडलों के लिए एक महत्वपूर्ण प्रतियोगी बन गया है।
मुख्य बिंदु:
🌟 Gemini2.0 Flash Thinking मॉडल में मजबूत अनुमान क्षमताएँ हैं, जो 32,000 इनपुट टोकन और 8,000 आउटपुट टोकन का समर्थन करता है।
💡 यह मॉडल ड्रॉप-डाउन मेनू के माध्यम से चरण-दर-चरण अनुमान प्रदान करता है, पारदर्शिता को बढ़ाता है, और AI "ब्लैक बॉक्स" समस्या का समाधान करता है।
🖼️ मूल छवि अपलोड और विश्लेषण क्षमताओं के साथ, यह बहु-मोडल अनुप्रयोग परिदृश्यों का विस्तार करता है।