हाल ही में, गूगल ने अपना नवीनतम इमेज जनरेशन मॉडल - Imagen3 पेश किया है, जो अब Gemini API पर डेवलपर्स के लिए उपलब्ध है। यह मॉडल दृश्य प्रभाव में उत्कृष्टता प्रदर्शित करता है, और यह विभिन्न शैलियों में उच्च गुणवत्ता वाली छवियाँ उत्पन्न करने में सक्षम है, जिसमें अतियथार्थवाद, इंप्रेशनिज्म परिदृश्य, अमूर्त कार्य और एनीमे पात्र शामिल हैं। Imagen3 ने छवियों की स्पष्टता और संरचना क्षमता को बढ़ाया है, और सरल पाठ संकेतों के माध्यम से उपयोगकर्ताओं को अपनी रचनाओं को छवियों में आसानी से बदलने में मदद करता है।

image.png

शुरुआत में, Imagen3 केवल भुगतान करने वाले उपयोगकर्ताओं के लिए उपलब्ध होगा, और अपेक्षित है कि जल्द ही इसे मुफ्त उपयोगकर्ताओं के लिए धीरे-धीरे पेश किया जाएगा। आधिकारिक जानकारी के अनुसार, उपयोगकर्ताओं को केवल प्रति छवि 0.03 डॉलर का भुगतान करना होगा, ताकि वे Imagen3 की शक्तिशाली सुविधाओं का लाभ उठा सकें। साथ ही, उपयोगकर्ता छवि उत्पन्न करते समय छवि के अनुपात और उत्पन्न विकल्पों की संख्या को स्वतंत्र रूप से नियंत्रित कर सकते हैं, जो विभिन्न आवश्यकताओं को पूरा करता है।

image.png

गलत सूचना और अनुचित क्रेडिट को रोकने के लिए, Imagen3 द्वारा उत्पन्न सभी छवियों में एक अदृश्य डिजिटल वॉटरमार्क SynthID होता है, जो छवि को पहचानने में मदद करता है कि यह कृत्रिम बुद्धिमत्ता द्वारा उत्पन्न की गई है। इसके अलावा, डेवलपर्स Python कोड के माध्यम से आसानी से छवि उत्पन्न कर सकते हैं, और आधिकारिक दस्तावेज में कोड के उदाहरण भी प्रदान किए गए हैं। उपयोगकर्ताओं को केवल API कुंजी सेट करने, संकेत शब्द दर्ज करने की आवश्यकता होती है, और वे इच्छित छवि उत्पन्न कर सकते हैं, इस नई तकनीक की सुविधा का अनुभव कर सकते हैं।

उपयोगकर्ताओं को Imagen3 की क्षमताओं को बेहतर ढंग से समझाने के लिए, अधिकारियों ने विभिन्न शैलियों और विषयों को कवर करते हुए उत्पन्न छवियों के नमूनों की एक श्रृंखला प्रदर्शित की है। जैसे-जैसे तकनीक में लगातार प्रगति हो रही है, गूगल ने Gemini API में अधिक जनरेटिव मीडिया मॉडल को जोड़ने की योजना बनाई है, ताकि जनरेटिव मीडिया और भाषा मॉडल के संयोजन को आगे बढ़ाया जा सके, और डेवलपर्स को अधिक दिलचस्प अनुप्रयोग बनाने में मदद मिल सके।

ब्लॉग: https://developers.googleblog.com/en/imagen-3-arrives-in-the-gemini-api/

मुख्य बिंदु:

🌟 Imagen3 अब Gemini API पर उपलब्ध है, जो विभिन्न शैलियों में उच्च गुणवत्ता वाली छवियाँ उत्पन्न करने की सेवा प्रदान करता है।  

💰 प्रति छवि उत्पन्न करने की लागत 0.03 डॉलर है, उपयोगकर्ताओं को अनुपात और उत्पन्न विकल्पों को कस्टमाइज़ करने का समर्थन मिलता है।  

🔒 सभी उत्पन्न छवियों में अदृश्य वॉटरमार्क होता है, ताकि गलत सूचना के प्रसार को रोका जा सके।