गूगल कंपनी और इसकी मातृ कंपनी एलेफाबेट के सीईओ सुंदर पिचाई ने घोषणा की है कि कंपनी ने अपना नवीनतम आर्टिफिशियल इंटेलिजेंस मॉडल - जेमिनी 2.0 लॉन्च किया है, जो गूगल के सामान्य एआई सहायक बनाने के क्षेत्र में एक महत्वपूर्ण कदम है। जेमिनी 2.0 मल्टी-मोडल इनपुट प्रोसेसिंग और नेटिव टूल्स के उपयोग में महत्वपूर्ण प्रगति दिखाता है, जिससे एआई एजेंटों को अपने चारों ओर की दुनिया को और गहराई से समझने में मदद मिलती है और उपयोगकर्ता की निगरानी में कार्रवाई करने की अनुमति मिलती है।
जेमिनी 2.0 अपने पूर्ववर्ती जेमिनी 1.0 और 1.5 पर आधारित है, जिसने पहली बार नेटिव मल्टी-मोडल प्रोसेसिंग क्षमताएं हासिल कीं, जो टेक्स्ट, वीडियो, इमेज, ऑडियो और कोड सहित विभिन्न प्रकार की जानकारी को समझने में सक्षम है। वर्तमान में, लाखों डेवलपर्स जेमिनी का उपयोग कर रहे हैं, जिससे गूगल अपने उत्पादों की फिर से कल्पना कर रहा है, जिसमें 2 अरब उपयोगकर्ताओं की सेवा करने वाले 7 उत्पाद शामिल हैं, और नए उत्पादों का निर्माण कर रहा है। नोटबुकएलएम मल्टी-मोडल और लंबे संदर्भ की क्षमताओं का एक उदाहरण है, जिसे व्यापक रूप से पसंद किया गया है।
जेमिनी 2.0 का लॉन्च गूगल के लिए एक नए एजेंट युग की शुरुआत का संकेत है, जिसमें मॉडल नेटिव इमेज और ऑडियो आउटपुट क्षमताओं के साथ-साथ नेटिव टूल्स के उपयोग की क्षमता भी है। गूगल ने पहले ही जेमिनी 2.0 को डेवलपर्स और विश्वसनीय परीक्षकों के लिए उपलब्ध कराना शुरू कर दिया है और इसे अपने उत्पादों में तेजी से एकीकृत करने की योजना बनाई है, सबसे पहले जेमिनी और सर्च में। आज से, जेमिनी 2.0 फ्लैश प्रयोगात्मक मॉडल सभी जेमिनी उपयोगकर्ताओं के लिए खुला है। साथ ही, गूगल ने एक नई सुविधा "डीप रिसर्च" भी लॉन्च की है, जो उन्नत अनुमानों और लंबे संदर्भ की क्षमताओं का उपयोग करके अनुसंधान सहायक के रूप में कार्य करती है, उपयोगकर्ताओं की ओर से जटिल विषयों का अन्वेषण करती है और रिपोर्ट तैयार करती है। यह सुविधा वर्तमान में जेमिनी एडवांस्ड में उपलब्ध है।
सर्च, जो एआई से प्रभावित सबसे बड़े उत्पादों में से एक है, गूगल का एआई ओवरव्यू अब 1 अरब लोगों तक पहुंच गया है, जिससे वे नए प्रश्न पूछने में सक्षम हैं, जो गूगल की सबसे लोकप्रिय खोज सुविधाओं में से एक बन गया है। अगले कदम के रूप में, गूगल जेमिनी 2.0 की उन्नत अनुमानों की क्षमताओं को एआई ओवरव्यू में लाएगा, ताकि अधिक जटिल विषयों और बहु-चरण समस्याओं को हल किया जा सके, जिसमें उच्च स्तर की गणितीय समीकरण, मल्टी-मोडल प्रश्न और कोडिंग शामिल हैं। इस सप्ताह सीमित परीक्षण शुरू हो गया है और अगले वर्ष की शुरुआत में इसे व्यापक रूप से लॉन्च करने की योजना है। गूगल भविष्य में अगले वर्ष में एआई ओवरव्यू को और अधिक देशों और भाषाओं में लाने पर भी ध्यान केंद्रित करेगा।
गूगल ने जेमिनी 2.0 की नेटिव मल्टी-मोडल क्षमताओं के माध्यम से अपने एजेंट अनुसंधान के अग्रणी परिणामों को भी प्रदर्शित किया है। जेमिनी 2.0 फ्लैश ने 1.5 फ्लैश के आधार पर सुधार किया है, जो अब तक का सबसे लोकप्रिय मॉडल है, जिसमें समान त्वरित प्रतिक्रिया समय है। ध्यान देने योग्य बात यह है कि 2.0 फ्लैश ने महत्वपूर्ण बेंचमार्क परीक्षणों में 1.5 प्रो को दो गुना तेजी से पार किया है। 2.0 फ्लैश ने नई क्षमताओं को भी लाया है। चित्र, वीडियो और ऑडियो जैसे मल्टी-मोडल इनपुट का समर्थन करने के अलावा, 2.0 फ्लैश अब मल्टी-मोडल आउटपुट का समर्थन करता है, जैसे कि टेक्स्ट के साथ मिश्रित नेटिव जनरेटेड इमेज और नियंत्रित बहुभाषी टेक्स्ट-टू-स्पीच (टीटीएस) ऑडियो। यह नेटिव टूल्स को भी कॉल कर सकता है, जैसे गूगल सर्च, कोड निष्पादन और तृतीय पक्ष उपयोगकर्ता परिभाषित कार्य।
जेमिनी 2.0 फ्लैश अब डेवलपर्स के लिए प्रयोगात्मक मॉडल के रूप में उपलब्ध है, और गूगल एआई स्टूडियो और वर्टेक्स एआई के जेमिनी एपीआई के माध्यम से, सभी डेवलपर्स मल्टी-मोडल इनपुट और टेक्स्ट आउटपुट का उपयोग कर सकते हैं, जबकि टेक्स्ट-टू-स्पीच और नेटिव इमेज जनरेशन प्रारंभिक पहुंच भागीदारों के लिए उपलब्ध है। सामान्य उपलब्धता जनवरी में आएगी, साथ ही अधिक मॉडल आकार भी लॉन्च किए जाएंगे।
डेवलपर्स को गतिशील और इंटरैक्टिव एप्लिकेशन बनाने में मदद करने के लिए, गूगल ने एक नया मल्टी-मोडल रियल-टाइम एपीआई भी जारी किया है, जिसमें रियल-टाइम ऑडियो, वीडियो स्ट्रीम इनपुट की क्षमता है और कई संयोजन टूल्स का उपयोग कर सकता है।
आज से, दुनिया भर के जेमिनी उपयोगकर्ता इसे डेस्कटॉप और मोबाइल वेब पर मॉडल ड्रॉप-डाउन मेनू में चुनकर 2.0 फ्लैश प्रयोग के चैट ऑप्टिमाइज्ड संस्करण तक पहुंच सकते हैं, जो जल्द ही जेमिनी मोबाइल ऐप में उपलब्ध होगा। अगले वर्ष की शुरुआत में, गूगल जेमिनी 2.0 को अधिक गूगल उत्पादों में विस्तारित करेगा।