अमेज़न चाहता है कि उपयोगकर्ता कृत्रिम बुद्धिमत्ता मॉडल का बेहतर मूल्यांकन कर सकें और इस प्रक्रिया में अधिक लोगों को शामिल होने के लिए प्रोत्साहित करता है। AWS ने अपने भंडार में मॉडल का मूल्यांकन करने के लिए Bedrock पर मॉडल मूल्यांकन पेश किया है। मॉडल मूल्यांकन में स्वचालित मूल्यांकन और मानव मूल्यांकन के दो भाग शामिल हैं, जो विभिन्न मानदंडों के आधार पर मॉडल के प्रदर्शन का मूल्यांकन कर सकते हैं। AWS मानव मूल्यांकन टीम भी प्रदान करता है जो उपयोगकर्ताओं के साथ मिलकर काम करती है, उन मानदंडों का पता लगाने के लिए जिन्हें स्वचालित प्रणाली पहचान नहीं पाती है। यह महत्वपूर्ण है कि मॉडल ग्राहकों के लिए काम करे, यह जानना आवश्यक है कि कौन सा मॉडल उनके लिए सबसे उपयुक्त है, हम उन्हें इस बात का बेहतर मूल्यांकन करने का एक तरीका प्रदान कर रहे हैं।