ज़िजुआन ने सभी क्षमताओं के साथ ऑमनीजेन विज़ुअल जनरेटिव मॉडल लॉन्च किया

AIbase基地

द्वारा प्रकाशितAI समाचार · 3 मिनट पढ़ें · Oct 29, 2024

713

बीजिंग ज़्हियुआन आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट (BAAI) ने हाल ही में एक पूरी तरह से नई बहुपरकार दृष्टि जनरेटिव मॉडल OmniGen लॉन्च करने की घोषणा की है, जो छवि जनरेशन के क्षेत्र में एक महत्वपूर्ण प्रगति का प्रतीक है। OmniGen मॉडल अपनी एकता, सरलता और क्रॉस-टास्क ज्ञान स्थानांतरण क्षमता के लिए प्रसिद्ध है, जो एक ही ढांचे के भीतर विभिन्न छवि जनरेशन कार्यों को संभालने में सक्षम है, जिसमें टेक्स्ट-टू-इमेज, इमेज संपादन, विषय-प्रेरित जनरेशन और दृश्य-शर्त जनरेशन शामिल हैं। इसके अलावा, OmniGen कुछ क्लासिक कंप्यूटर विज़न कार्यों जैसे छवि शोर हटाना और किनारे पहचानने को भी संभाल सकता है, जो इन कार्यों को छवि जनरेशन कार्यों में परिवर्तित करके किया जाता है।

微信截图_20241029103628.png

OmniGen की मुख्य ताकत इसके सरल संरचना और उपयोगकर्ता-अनुकूल संचालन में है, उपयोगकर्ता सरल निर्देशों के माध्यम से जटिल छवि जनरेशन कार्यों को पूरा कर सकते हैं, बिना किसी अतिरिक्त प्लगइन या जटिल प्रक्रिया के कदमों की आवश्यकता के। इस एकीकृत प्रारूप की सीख OmniGen को विभिन्न कार्यों के बीच ज्ञान स्थानांतरित करने में सक्षम बनाती है, नए कार्यों और क्षेत्रों का सामना करने और नए कार्यों का प्रदर्शन करने में।

OmniGen मॉडल की क्षमताएँ केवल उपरोक्त तक सीमित नहीं हैं, बल्कि इसमें शोर हटाने और किनारे निकालने जैसी बुनियादी छवि प्रसंस्करण क्षमताएँ भी शामिल हैं। मॉडल का वज़न और कोड ओपन-सोर्स किया गया है, ताकि उपयोगकर्ता OmniGen की अधिक क्षमताओं का अन्वेषण कर सकें और आवश्यकता के अनुसार समायोजन कर सकें। ज़्हियुआन रिसर्च इंस्टीट्यूट ने एक बड़े पैमाने पर और विविध एकीकृत छवि जनरेशन डेटासेट X2I का निर्माण किया है, जिसमें लगभग 1 करोड़ छवियाँ शामिल हैं, जो भविष्य में ओपन-सोर्स की जाएगी, ताकि सामान्य छवि जनरेशन क्षेत्र के विकास को बढ़ावा मिल सके।

संबंधित लिंक:

पत्र: https://arxiv.org/pdf/2409.11340

कोड: https://github.com/VectorSpaceLab/OmniGen

डेमो: https://huggingface.co/spaces/Shitao/OmniGen

ऑमनीजेन सभी क्षमताओं वाला विज़ुअल जनरेटिव मॉडल छवि निर्माण कंप्यूटर दृष्टि

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

OpenAI GPT-4o छवि निर्माण में वॉटरमार्क जोड़ रहा है, Plus सदस्यों को विशेषाधिकार मिलेगा

OpenAI अपने GPT-4o छवि निर्माण मॉडल में वॉटरमार्क जोड़ने की सुविधा का परीक्षण कर रहा है। हाल ही में, ChatGPT अपनी शक्तिशाली छवि निर्माण क्षमताओं के लिए चर्चा में रहा है, यह मॉडल न केवल पाठ के साथ सटीक छवियां बना सकता है, बल्कि अत्यधिक यथार्थवादी दृश्य कार्य भी बना सकता है, यहां तक कि प्रसिद्ध एनीमेशन स्टूडियो जैसे स्टूडियो जिबली की कला शैली की नकल भी कर सकता है। चित्र स्रोत टिप्पणी: छवि AI द्वारा उत्पन्न की गई है, छवि अधिकार सेवा प्रदाता Midjourney, कथित तौर पर, शुरू में केवल ChatGPT Plus उपयोगकर्ताओं के लिए उपलब्ध है।

Apr 7, 2025

ChatGPT ने फिर से इमेज जेनरेट करने की क्षमता को अपडेट किया है, अब यह कुरसी लिपि भी लिख सकता है

इन दिनों, ChatGPT ने अपनी इमेज जेनरेट करने की क्षमता में सुधार के कारण नए उपयोगकर्ताओं में उल्लेखनीय वृद्धि देखी है, जिससे भुगतान करने वाले उपयोगकर्ताओं की संख्या में 20 मिलियन की वृद्धि हुई है। इन दिनों लोगों द्वारा साझा किए गए विभिन्न तरीकों से हमें ChatGPT4O की क्षमताओं का सम्मान करने के लिए प्रेरित किया गया है, यहां तक कि पहले जिन चीजों में यह कमजोर था, जैसे चीनी भाषा में लिखना, उनमें भी सुधार हुआ है। और अब, ChatGPT ने Creat image फ़ंक्शन को फिर से अपडेट किया है। कुछ दिन पहले तक यह केवल साधारण फ़ॉन्ट बना सकता था, लेकिन अब यह कुरसी लिपि भी बना सकता है, और वह भी सटीकता के साथ।

Apr 3, 2025

GPT-4o की इमेज जेनरेशन क्षमता शीर्ष स्तर पर पहुँची: कई क्षेत्रों में शानदार प्रदर्शन, AI रचनात्मकता की सीमा को चुनौती

हाल ही में, आर्टिफिशियल इंटेलिजेंस के क्षेत्र में फिर से बहस छिड़ गई है, OpenAI का GPT-4o इमेज जेनरेशन मॉडल अपने बेहतरीन प्रदर्शन के कारण उद्योग के आधिकारिक मूल्यांकन में सबसे आगे निकल गया है। हालिया सोशल मीडिया चर्चाओं से पता चलता है कि इमेज जेनरेशन क्वालिटी के ELO स्कोर में GPT-4o नए मॉडल Reve के साथ संयुक्त रूप से पहले स्थान पर है, जिसने Recraft V3, FLUX1.1[pro] और Google के Gemini2.0Flash जैसे मजबूत प्रतिद्वंद्वियों को पीछे छोड़ दिया है। यह उपलब्धि न केवल OpenAI को जेनरेटिव AI के क्षेत्र में मजबूत स्थिति प्रदान करती है, बल्कि...

Apr 1, 2025

ChatGPT की छवि निर्माण क्षमता का शुभारंभ: मुफ़्त उपयोगकर्ताओं के लिए रचनात्मकता के नए अवसर

तेजी से विकसित हो रहे तकनीकी युग में, कृत्रिम बुद्धिमत्ता (AI) हमारे जीवन के हर पहलू में अद्भुत गति से प्रवेश कर रही है। हाल ही में, ChatGPT में एक बहुप्रतीक्षित नई सुविधा जोड़ी गई है - AI छवि निर्माण। इस सुविधा ने न केवल उपयोगकर्ताओं की रचनात्मक आवश्यकताओं को पूरा किया है, बल्कि अपनी अनूठी 'जिबली शैली' के कारण भी इसे व्यापक स्वागत मिला है। हालाँकि, इस नई सुविधा के शुभारंभ से कुछ विवाद भी उत्पन्न हुए हैं, खासकर प्रसिद्ध एनिमेशन निर्देशक हयाओ मियाज़ाकी ने AI जनित कला के प्रति अपनी नाराज़गी सार्वजनिक रूप से व्यक्त की है। इस छवि निर्माण उपकरण के शुभारंभ से यह संकेत मिलता है कि

Mar 31, 2025

एआई दैनिक: ज़िझुपु ने एजेंट उत्पाद ऑटोग्लैम चिंतन जारी किया; गूगल जेमिनी 2.5 प्रो मुफ्त में उपयोग के लिए उपलब्ध; ChatGPT ने मुफ़्त उपयोगकर्ताओं के लिए मूल छवि निर्माण कार्यक्षमता शुरू की

【एआई दैनिक】 खंड में आपका स्वागत है! यह आपका दैनिक मार्गदर्शक है जो आपको कृत्रिम बुद्धिमत्ता की दुनिया का पता लगाने में मदद करता है। हम प्रतिदिन एआई क्षेत्र की प्रमुख खबरें आपके लिए लाते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, और आपको तकनीकी रुझानों और नवीन एआई उत्पाद अनुप्रयोगों को समझने में मदद करते हैं। नए एआई उत्पादों के बारे में जानने के लिए यहां क्लिक करें: https://top.aibase.com/1、ज़िझुपु ने एजेंट उत्पाद ऑटोग्लैम चिंतन जारी किया: पहला बुद्धिमान एजेंट जो सोचते हुए काम करता है ज़िझुपु एआई ने 2025 झोंगगुआनचुन फ़ोरम में अपने नवीनतम एजेंट उत्पाद - ऑटोग्लैम को जारी किया।

Mar 31, 2025

ChatGPT ने चुपके से मुफ़्त उपयोगकर्ताओं के लिए मूल छवि निर्माण सुविधा शुरू की

OpenAI द्वारा हाल ही में शुरू की गई ChatGPT छवि निर्माण सुविधा ने सोशल मीडिया पर व्यापक ध्यान आकर्षित किया है, खासकर इसकी "घिबली शैली" छवि निर्माण को कई उपयोगकर्ताओं ने पसंद किया है। पहले OpenAI ने यह मूल छवि निर्माण सुविधा केवल वैश्विक ChatGPT Plus, Pro और Team भुगतान करने वाले उपयोगकर्ताओं के लिए शुरू की थी, अब ChatGPT की यह नई सुविधा सभी मुफ़्त उपयोगकर्ताओं के लिए उपलब्ध हो गई है। संवाद बॉक्स के नीचे दिखाई देने वाला "चित्र बनाएँ" अपडेट हो गया है, जो विचारों और अवधारणाओं को साकार करने में मदद करता है।

Mar 31, 2025

नोड्स के बुरे सपने को अलविदा कहें! ComfyUI-C opilot जारी, इसमें GPT-4o जैसी इमेज जेनरेशन और एडिटिंग क्षमता है

हाल ही में, ComfyUI-C opilot नामक एक नवीनतम उपकरण ने आर्टिफिशियल इंटेलिजेंस द्वारा जनित सामग्री के क्षेत्र में व्यापक ध्यान आकर्षित किया है। यह उपकरण प्राकृतिक भाषा संसाधन को ComfyUI के नोड-आधारित वर्कफ़्लो के साथ जोड़कर उपयोगकर्ताओं को GPT-4o जैसी छवि निर्माण और संपादन क्षमता प्रदान करता है। इसके आगमन से न केवल उपयोग की दहलीज में भारी कमी आई है, बल्कि नए और अनुभवी उपयोगकर्ताओं के लिए एक कुशल और बुद्धिमान निर्माण मंच भी प्रदान किया गया है, जो दर्शाता है कि AI छवि निर्माण तकनीक अधिक मानवीय और स्वचालित दिशा में एक महत्वपूर्ण कदम है।

Mar 31, 2025

आइडियोग्राम ने आधिकारिक तौर पर 3.0 संस्करण मॉडल जारी किया: यथार्थवाद और रचनात्मक अभिव्यक्ति में एक और सफलता

आइडियोग्राम ने अपने नवीनतम छवि निर्माण मॉडल-आइडियोग्राम 3.0 को लॉन्च करने की आधिकारिक घोषणा की है। इस संस्करण ने यथार्थवाद, रचनात्मक अभिव्यक्ति और शैलीगत संगति में उल्लेखनीय प्रगति हासिल की है, जिसे छवि निर्माण के क्षेत्र में एक महत्वपूर्ण उपलब्धि माना जा रहा है। नया मॉडल न केवल GPT-4o जैसे शीर्ष AI सिस्टम के बराबर है, बल्कि अपने कुशल प्रदर्शन और नवीन कार्यों के साथ व्यापक ध्यान आकर्षित करता है। आइडियोग्राम 3.0 ने पाठ प्रतिपादन क्षमता में गुणात्मक छलांग लगाई है। बाजार में मौजूद अधिकांश छवि निर्माण मॉडल की तुलना में, यह संस्करण

Mar 27, 2025

OpenAI ने नवीनतम छवि निर्माण मॉडल जारी किया: GPT-4o में बहु-चरण संवाद संपादन कार्यक्षमता अंतर्निहित है

25 मार्च, 2025 को, OpenAI ने घोषणा की कि इसका नवीनतम छवि निर्माण मॉडल आधिकारिक तौर पर GPT-4o में अंतर्निहित है, यह अभूतपूर्व उन्नयन उपयोगकर्ताओं के लिए अधिक शक्तिशाली छवि निर्माण और संपादन अनुभव लाता है। ऐसा कहा जाता है कि यह फ़ंक्शन आज से ChatGPT और Sora के सभी Plus, Pro, Team और मुफ़्त उपयोगकर्ताओं के लिए चरणबद्ध तरीके से जारी किया जा रहा है। इस खबर ने तकनीकी जगत में व्यापक ध्यान आकर्षित किया है।

Mar 26, 2025

130

PiT फ़्रेमवर्क का उदय: छवि के कुछ टुकड़ों को अपलोड करके पूरी छवि उत्पन्न करना

हाल ही में, कृत्रिम बुद्धिमत्ता के क्षेत्र में PiT (विज़ुअल पार्ट्स पर आधारित छवि निर्माण फ़्रेमवर्क) नामक एक नई तकनीक ने चर्चाएँ छेड़ दी हैं। ऐसा कहा जाता है कि यह नवीन फ़्रेमवर्क छवि के बिखरे हुए टुकड़ों को इनपुट करके, स्वचालित रूप से 'पूरा' कर सकता है और एक पूरी छवि उत्पन्न कर सकता है, जिससे छवि निर्माण तकनीक में क्रांतिकारी बदलाव आया है। पारंपरिक टेक्स्ट प्रॉम्प्ट पर निर्भर किए बिना, PiT अपने अनूठे विज़ुअल इनपुट तरीके और शक्तिशाली निर्माण क्षमता के साथ, दुनिया भर के डेवलपर्स और रचनात्मक लोगों का ध्यान आकर्षित कर रहा है। PiT का कार्य सिद्धांत आश्चर्यजनक है: उपयोगकर्ताओं को केवल कुछ यादृच्छिक छवि के टुकड़े प्रदान करने की आवश्यकता है,

Mar 25, 2025

AI समाचार

AI दैनिक

AI समयरेखा

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT

अवलोकन

ज़िजुआन ने सभी क्षमताओं के साथ ऑमनीजेन विज़ुअल जनरेटिव मॉडल लॉन्च किया

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

OpenAI GPT-4o छवि निर्माण में वॉटरमार्क जोड़ रहा है, Plus सदस्यों को विशेषाधिकार मिलेगा

ChatGPT ने फिर से इमेज जेनरेट करने की क्षमता को अपडेट किया है, अब यह कुरसी लिपि भी लिख सकता है

GPT-4o की इमेज जेनरेशन क्षमता शीर्ष स्तर पर पहुँची: कई क्षेत्रों में शानदार प्रदर्शन, AI रचनात्मकता की सीमा को चुनौती

ChatGPT की छवि निर्माण क्षमता का शुभारंभ: मुफ़्त उपयोगकर्ताओं के लिए रचनात्मकता के नए अवसर

ChatGPT ने चुपके से मुफ़्त उपयोगकर्ताओं के लिए मूल छवि निर्माण सुविधा शुरू की

नोड्स के बुरे सपने को अलविदा कहें! ComfyUI-C opilot जारी, इसमें GPT-4o जैसी इमेज जेनरेशन और एडिटिंग क्षमता है

आइडियोग्राम ने आधिकारिक तौर पर 3.0 संस्करण मॉडल जारी किया: यथार्थवाद और रचनात्मक अभिव्यक्ति में एक और सफलता

OpenAI ने नवीनतम छवि निर्माण मॉडल जारी किया: GPT-4o में बहु-चरण संवाद संपादन कार्यक्षमता अंतर्निहित है

PiT फ़्रेमवर्क का उदय: छवि के कुछ टुकड़ों को अपलोड करके पूरी छवि उत्पन्न करना