गूगल लैब्स ने हाल ही में अमेरिका में नवीनतम जनरेटिव आर्टिफिशियल इंटेलिजेंस प्रयोगात्मक उपकरण Whisk लॉन्च किया है। पारंपरिक इमेज जनरेशन उपकरणों के विपरीत, जो मुख्य रूप से टेक्स्ट प्रॉम्प्ट पर निर्भर करते हैं, Whisk छवियों को इनपुट विधि के रूप में प्राथमिकता देता है, जिससे उपयोगकर्ता कला के काम को अधिक सहजता से बना सकते हैं।
उपयोगकर्ता सीधे Whisk पर चित्र अपलोड कर सकते हैं, या इस उपकरण में चित्र उत्पन्न कर सकते हैं, विषय, दृश्य और शैली जैसे तत्व निर्दिष्ट कर सकते हैं। Whisk प्रणाली उपयोगकर्ताओं को इन घटकों को मिश्रित और मिलाने की अनुमति देती है, और आवश्यकतानुसार अतिरिक्त टेक्स्ट प्रॉम्प्ट का उपयोग करके ट्यूनिंग कर सकती है।
यह ध्यान देने योग्य है कि बैकग्राउंड में, गूगल का भाषा मॉडल (संभवतः हाल ही में जारी किया गया Gemini2.0Flash) स्वचालित रूप से इनपुट छवि का विस्तृत विवरण उत्पन्न करता है। ये विवरण गूगल के नवीनतम इमेज जनरेशन मॉडल Imagen3 में डाला जाता है, ताकि विषय की मूल विशेषताओं को कैप्चर किया जा सके, न कि पूरी तरह से समान प्रतिकृतियाँ बनाई जा सकें।
AIbase ने कई परीक्षण किए, और बाईं ओर की तीन छवियों को अपलोड करने पर, दाईं ओर का परिणाम उत्पन्न किया जा सकता है, जो कि काफी अच्छा है और खेलने की उच्च संभावना है। नीचे:
हालांकि, चूंकि Whisk प्रत्येक स्रोत छवि से केवल कुछ प्रमुख तत्व निकालता है, गूगल ने उपयोगकर्ताओं को चेतावनी दी है कि उत्पन्न छवियों के परिणाम अपेक्षित से भिन्न हो सकते हैं। उदाहरण के लिए, उत्पन्न छवियाँ ऊँचाई, वजन, हेयरस्टाइल या त्वचा के रंग में मूल चित्र से भिन्न हो सकती हैं।
इस पर, गूगल ने कहा है कि ये विवरण अक्सर परियोजना की सफलता के लिए महत्वपूर्ण होते हैं, इसलिए उपयोगकर्ताओं को छवि उत्पन्न प्रक्रिया को संचालित करने वाले टेक्स्ट प्रॉम्प्ट को देखने और संपादित करने की अनुमति दी जाती है।
प्रारंभिक परीक्षक, जिनमें कुछ कलाकार और रचनात्मक पेशेवर शामिल हैं, ने कहा कि Whisk एक नए रचनात्मक उपकरण की तरह है, न कि पारंपरिक छवि संपादक के रूप में। गूगल चाहता है कि यह उपकरण उपयोगकर्ताओं को तेजी से दृश्य मस्तिष्क तूफान करने में मदद करे, न कि सटीक संपादन करने में, ताकि उपयोगकर्ता अपने पसंदीदा काम को सहेजने से पहले कई विकल्पों को तेजी से उत्पन्न और छान सकें।
प्रारंभिक परीक्षण के अनुसार, हालांकि Whisk का उपयोग करना बहुत सुखद है, लेकिन प्रत्येक नई छवि उत्पन्न करने के लिए कुछ सेकंड का इंतजार करना पड़ता है। ये देरी उच्च ट्रैफ़िक के कारण हो सकती है, क्योंकि उपयोगकर्ता इस नए उपकरण का अनुभव करने के लिए उमड़ रहे हैं।
वर्तमान में, Whisk केवल अमेरिका के उपयोगकर्ताओं के लिए खुला है, उपयोगकर्ता labs.google/whisk पर मुफ्त में प्रयास कर सकते हैं और फीडबैक साझा कर सकते हैं। अन्य देशों के उपयोगकर्ताओं के लिए, इस उपकरण तक पहुँच अस्थायी रूप से उपलब्ध नहीं है।
Whisk गूगल लैब्स के अधीन है, जो गूगल के AI परियोजनाओं के परीक्षण स्थल है, जिसमें Gemini, Imagen और नवीनतम वीडियो मॉडल Veo2 शामिल हैं। जबकि अधिकांश परियोजनाएँ अभी भी प्रयोगात्मक चरण में हैं, कुछ सफल परियोजनाएँ, जैसे हाल ही में आधिकारिक रूप से जारी किया गया AI सहायक NotebookLM, पूर्ण उत्पाद में बदल जाएँगी।
उत्पाद अनुभव का पता: https://top.aibase.com/tool/whisk
मुख्य बिंदु:
🌟 गूगल ने Whisk लॉन्च किया, पहला छवि-प्रधान जनरेटिव AI उपकरण।
🎨 उपयोगकर्ता छवियों को अपलोड या उत्पन्न कर सकते हैं, तेजी से दृश्य डिज़ाइन कर सकते हैं न कि सटीक संपादन।
🚫 वर्तमान में केवल अमेरिका के उपयोगकर्ताओं के लिए परीक्षण, अन्य देशों के लिए अस्थायी रूप से उपलब्ध नहीं।