PARTNR
बहु-एजेंट कार्य योजना और अनुमान के लिए बेंचमार्क
सामान्य उत्पादअन्यबहु-एजेंटप्राकृतिक भाषा संसाधन
PARTNR मेटा FAIR द्वारा जारी एक बड़ा बेंचमार्क है जिसमें 100,000 प्राकृतिक भाषा कार्य शामिल हैं, जिसका उद्देश्य बहु-एजेंट अनुमान और योजना का अध्ययन करना है। PARTNR बड़े भाषा मॉडल (LLM) का उपयोग कार्यों को उत्पन्न करने के लिए करता है और त्रुटियों को कम करने के लिए सिमुलेटेड लूप का उपयोग करता है। यह वास्तविक मानव भागीदारों के साथ AI एजेंटों के मूल्यांकन का भी समर्थन करता है, जो मानव-इन-द-लूप अवसंरचना के माध्यम से होता है। PARTNR मौजूदा LLM-आधारित योजनाकारों में कार्य समन्वय, ट्रैकिंग और त्रुटियों से उबरने में उल्लेखनीय सीमाओं को उजागर करता है, मानव 93% कार्यों को हल कर सकते हैं, जबकि LLM केवल 30% ही हल कर पाते हैं।
PARTNR नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
23286
बाउंस दर
45.85%
प्रति विज़िट औसत पृष्ठ
2.0
औसत विज़िट अवधि
00:01:59