एप्पल रिसर्च ने MAD-Bench बेंचमार्क प्रस्तुत किया, जो मल्टी-मॉडल बड़े भाषा मॉडल (MLLMs) द्वारा भ्रामक जानकारी की कमजोरी को हल करता है। इस अध्ययन में 850 चित्र संकेत जोड़े शामिल हैं, जो MLLMs की पाठ और चित्र संगति को संभालने की क्षमता का मूल्यांकन करते हैं। अध्ययन से पता चला कि GPT-4V दृश्य समझ और दृश्य भ्रम में बेहतर प्रदर्शन करता है, जो AI मॉडल के डिज़ाइन के लिए महत्वपूर्ण संकेत प्रदान करता है। MAD-Bench बेंचमार्क के माध्यम से, AI मॉडल की मजबूती में सुधार होगा, और भविष्य के शोध अधिक विश्वसनीय होंगे।
Apple ने MAD-Bench मानक पेश किया, जो मल्टी-मोड़ल बड़े भाषा मॉडल की भ्रांतियों की समस्या को हल करता है

站长之家
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।