एप्पल रिसर्च ने MAD-Bench बेंचमार्क प्रस्तुत किया, जो मल्टी-मॉडल बड़े भाषा मॉडल (MLLMs) द्वारा भ्रामक जानकारी की कमजोरी को हल करता है। इस अध्ययन में 850 चित्र संकेत जोड़े शामिल हैं, जो MLLMs की पाठ और चित्र संगति को संभालने की क्षमता का मूल्यांकन करते हैं। अध्ययन से पता चला कि GPT-4V दृश्य समझ और दृश्य भ्रम में बेहतर प्रदर्शन करता है, जो AI मॉडल के डिज़ाइन के लिए महत्वपूर्ण संकेत प्रदान करता है। MAD-Bench बेंचमार्क के माध्यम से, AI मॉडल की मजबूती में सुधार होगा, और भविष्य के शोध अधिक विश्वसनीय होंगे।