AI समाचार

वैश्विक AI नवाचार का कोई भी क्षण न चूकें

AI दैनिक

दैनिक तीन मिनट का AI उद्योग रुझान

AI समयरेखा

AI उद्योग मील के पत्थर

AI मुद्रीकरण गाइड

नवीनतम मामले

AI मुद्रीकरण मामला साझा करना

छवि संग्रह

AI छवि निर्माण मुद्रीकरण मामले

वीडियो संग्रह

AI वीडियो निर्माण मुद्रीकरण मामले

ऑडियो संग्रह

AI ऑडियो निर्माण मुद्रीकरण मामले

सामग्री संग्रह

AI सामग्री लेखन मुद्रीकरण मामले

AI ट्यूटोरियल

नवीनतम ट्यूटोरियल

नवीनतम AI ट्यूटोरियल का मुफ्त साझाकरण

AI उत्पाद रैंकिंग

AI वेबसाइटों की कुल विज़िट रैंकिंग दिखाता है

AI ट्रैफ़िक वृद्धि रैंकिंग

ट्रैफ़िक द्वारा सबसे तेज़ी से बढ़ती AI वेबसाइटों को ट्रैक करें

AI ट्रैफ़िक गिरावट रैंकिंग

महत्वपूर्ण ट्रैफ़िक गिरावट वाली AI वेबसाइटों पर ध्यान दें

AI साप्ताहिक रैंकिंग

AI वेबसाइटों की साप्ताहिक विज़िट रैंकिंग दिखाता है

AI ओपन सोर्स प्रोजेक्ट लाइब्रेरी

अवलोकन

GitHub लोकप्रिय AI ओपन सोर्स प्रोजेक्ट का अवलोकन

उत्पाद लाइब्रेरी टूल नेविगेशन

Adobe और विश्वविद्यालयों ने मिलकर METAL ढाँचा जारी किया: बहु-एजेंट सहयोग से सटीक चार्ट बनाना

AIbase基地

द्वारा प्रकाशितAI समाचार · 7 मिनट पढ़ें · Mar 3, 2025

आज के डेटा विज़ुअलाइज़ेशन के क्षेत्र में, जटिल डेटा को सटीक रूप से दर्शाने वाले चार्ट बनाना अभी भी एक चुनौतीपूर्ण काम है। चार्ट को न केवल सटीक लेआउट, रंग और टेक्स्ट पोजिशन को कैप्चर करने की आवश्यकता होती है, बल्कि इन दृश्य विवरणों को कोड में बदलने की भी आवश्यकता होती है ताकि अपेक्षित डिज़ाइन को दोहराया जा सके। हालाँकि, पारंपरिक तरीके आमतौर पर सीधे दृश्य-भाषा मॉडल (VLM) जैसे GPT-4V को निर्देशित करने पर निर्भर करते हैं, जिससे जटिल दृश्य तत्वों को सिंटैक्टिक रूप से सही पायथन कोड में बदलने में कठिनाई होती है। यहां तक कि छोटी सी गलती भी चार्ट को डिज़ाइन लक्ष्य तक नहीं पहुँचने का कारण बन सकती है, जो वित्तीय विश्लेषण, शैक्षणिक अनुसंधान और शैक्षिक रिपोर्ट जैसे क्षेत्रों में विशेष रूप से महत्वपूर्ण है।

इस समस्या को हल करने के लिए, UCLA (कैलिफ़ोर्निया विश्वविद्यालय, लॉस एंजिल्स), UC Merced और Adobe रिसर्च टीम ने METAL नामक एक नया ढाँचा प्रस्तुत किया है। यह सिस्टम चार्ट निर्माण कार्य को कई चरणों में विभाजित करता है जिनका प्रबंधन विशेष एजेंटों द्वारा किया जाता है।

METAL फ़्रेमवर्क में चार प्रमुख एजेंट शामिल हैं: एक जनरेटिव एजेंट, एक विज़ुअल मूल्यांकन एजेंट, एक कोड मूल्यांकन एजेंट और एक संशोधन एजेंट। जनरेटिव एजेंट प्रारंभिक पायथन कोड उत्पन्न करने के लिए जिम्मेदार है, विज़ुअल मूल्यांकन एजेंट उत्पन्न चार्ट और संदर्भ चार्ट के बीच संगति का मूल्यांकन करता है, कोड मूल्यांकन एजेंट किसी भी सिंटैक्टिक या तार्किक त्रुटियों के लिए उत्पन्न कोड की समीक्षा करता है, और संशोधन एजेंट मूल्यांकन प्रतिक्रिया के आधार पर कोड को समायोजित करता है।

METAL का मॉड्यूलर डिज़ाइन इसकी एक बड़ी खासियत है। यह दृश्य व्याख्या और कोड निर्माण कार्यों को विभिन्न एजेंटों को सौंपकर, प्रत्येक एजेंट को अपने विशिष्ट कार्य पर ध्यान केंद्रित करने की अनुमति देता है। यह दृष्टिकोण सुनिश्चित करता है कि चार्ट के दृश्य और तकनीकी तत्वों पर पूरी तरह से विचार किया जाता है और उन्हें समायोजित किया जाता है, जिससे चार्ट निर्माण की सटीकता और स्थिरता में सुधार होता है।

प्रयोगों में, METAL का प्रदर्शन ChartMIMIC डेटासेट पर मूल्यांकन किया गया था, और परिणामों से पता चला है कि यह पारंपरिक तरीकों की तुलना में टेक्स्ट स्पष्टता, चार्ट प्रकार की सटीकता, रंग स्थिरता और लेआउट सटीकता में बेहतर है। ओपन-सोर्स मॉडल LLAMA3.2-11B और क्लोज्ड-सोर्स मॉडल GPT-4O के साथ तुलना से पता चला है कि METAL द्वारा उत्पन्न चार्ट संदर्भ चार्ट के करीब सटीकता के साथ हैं।

इसके अतिरिक्त, शोध ने एबलेशन प्रयोगों के माध्यम से दृश्य और कोड मूल्यांकन तंत्र को अलग करने के महत्व पर प्रकाश डाला है। जब इन दो घटकों को एक मूल्यांकन एजेंट में मिला दिया जाता है, तो प्रदर्शन अक्सर कम हो जाता है, यह दर्शाता है कि उच्च-गुणवत्ता वाले चार्ट निर्माण के लिए विशेष मूल्यांकन विधियाँ महत्वपूर्ण हैं।

METAL विशिष्ट, पुनरावृति चरणों में कार्यों को विभाजित करके एक संतुलित बहु-एजेंट दृष्टिकोण प्रदान करता है। यह दृष्टिकोण न केवल दृश्य डिज़ाइन को पायथन कोड में सटीक रूप से बदलने को बढ़ावा देता है, बल्कि त्रुटि का पता लगाने और सुधार के लिए एक व्यवस्थित प्रक्रिया भी प्रदान करता है। कंप्यूटेशनल संसाधनों में वृद्धि के साथ, METAL का प्रदर्शन लगभग रैखिक रूप से बढ़ता है, जो उच्च सटीकता की आवश्यकता वाले अनुप्रयोगों में इसकी व्यावहारिक क्षमता प्रदान करता है।

परियोजना:https://metal-chart-generation.github.io/

मुख्य बातें:
🌟 METAL फ़्रेमवर्क UCLA, UC Merced और Adobe द्वारा संयुक्त रूप से प्रस्तुत किया गया है, जिसका उद्देश्य चार्ट निर्माण प्रक्रिया को अनुकूलित करना है।
🔍 फ़्रेमवर्क में चार विशेष एजेंट शामिल हैं, जो क्रमशः चार्ट उत्पन्न करने, मूल्यांकन करने और संशोधित करने के लिए जिम्मेदार हैं, यह सुनिश्चित करते हुए कि दृश्य और तकनीकी तत्वों को ठीक से संभाला जाता है।
📈 प्रयोगात्मक परिणाम बताते हैं कि METAL पारंपरिक तरीकों की तुलना में चार्ट निर्माण की सटीकता और स्थिरता में बेहतर है, जो इसकी अच्छी व्यावहारिक क्षमता को दर्शाता है।

धातु चार्ट निर्माण दृश्य-भाषाई मॉडल डाटा विज़ुअलाइज़ेशन

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

DiagrammerGPT: GPT-4 विज्ञान चार्ट निर्माण के नए युग की अगुवाई कर रहा है

नॉर्थ कैरोलिना विश्वविद्यालय ने DiagrammerGPT ढांचा पेश किया है, जो GPT-4 की शक्तिशाली भाषा प्रसंस्करण क्षमता का उपयोग कर विज्ञान चार्ट निर्माण में क्रांतिकारी सुधार लाता है। यह ढांचा एक बंद लूप फीडबैक तंत्र के माध्यम से GPT-4 को ‘योजनाकार’ और ‘ऑडिटर’ के रूप में कार्य करता है, जो चार्ट निर्माण की सटीकता को बढ़ाता है। चार्ट की योजना चरण में, DiagramGLIGEN प्रसार मॉडल का उपयोग किया जाता है, जिसमें पाठ लेबल को रेंडर करने के लिए Pillow लाइब्रेरी का संयोजन होता है, जिससे सटीक चार्ट का उत्पादन अनुकूलित होता है। परीक्षण डेटा दर्शाते हैं कि DiagrammerGPT दूसरे मॉडलों की तुलना में स्पष्ट रूप से बेहतर है।

Nov 20, 2023

730

IBM ने Watsonx.Governance लॉन्च किया, जो कंपनियों और सरकारों को जनरेटिव AI पर विश्वास बनाने में मदद करता है

IBM Watsonx.Governance टूलकिट लॉन्च करेगा, जो कंपनियों और सरकारों को जनरेटिव AI पर विश्वास बनाने में मदद करता है। Watsonx जोखिम प्रबंधन, पारदर्शिता बढ़ाने और भविष्य के कृत्रिम बुद्धिमत्ता नियामक अनुपालन की भविष्यवाणी करने के लिए टूलकिट प्रदान करता है। Watsonx का उपयोग करके, कंपनियां कृत्रिम बुद्धिमत्ता शासन प्रक्रिया का स्वचालन कर सकती हैं, मॉडलों की निगरानी और प्रबंधन कर सकती हैं।

Nov 16, 2023

810

बायडू वेंक्सिन यियान ने खोज, चिंतन वीडियो, चार्ट निर्माण आदि 5 मुख्य प्लगइन्स का शुरू किया

{पॉइंट 1: बायडू वेंक्सिन यियान ने बायडू खोज, दस्तावेज़ ब्राउज़िंग, E वायनीचित्र, शैली चित्रण, एक कैमरा प्रवाह वीडियो के पांच मुख्य प्लगइन्स का लॉन्च किया। पॉइंट 2: बायडू वेंक्सिन यियान के प्लगइन्स मॉडल को वास्तविक समय में सटीक जानकारी उत्पन्न करने, लंबे पाठ का सारांश देने और प्रश्न-उत्तर, डेटा अंतर्दृष्टि और चार्ट निर्माण, चित्र आधारित निर्माण और प्रश्न-उत्तर, चिंतन वीडियो आदि की क्षमताओं से लैस बनाते हैं। पॉइंट 3: बायडू ने घोषणा की है कि वह डेवलपर्स के साथ मिलकर प्लगइन पारिस्थितिकी तंत्र का निर्माण करेगा, तकनीकी नवाचार के परिणामों को साझा करेगा।}

Aug 17, 2023

280

AI समाचार

AI दैनिक

AI समयरेखा

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT