in
AI उत्पाद रैंकिंग
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
होम
AI समाचार
AI दैनिक
मुद्रीकरण गाइड
AI ट्यूटोरियल
AI उपकरण नेविगेशन
AI उत्पाद लाइब्रेरी
in
AI उत्पाद रैंकिंग
वैश्विक AI उत्पाद गतिशीलता खोजें
वैश्विक AI जानकारी खोजें, AI में नए अवसर खोजें
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
प्रकार :
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
2024-08-15 14:53:25
.
AIbase
.
11.1k
OpenAI ने SWE-bench Verified लॉन्च किया: AI सॉफ़्टवेयर इंजीनियरिंग क्षमताओं के मूल्यांकन को बढ़ाना
OpenAI ने SWE-bench Verified जारी किया, जिसका उद्देश्य सॉफ़्टवेयर इंजीनियरिंग कार्यों में AI के प्रदर्शन का अधिक सटीक मूल्यांकन करना है, प्राचीन SWE-bench में मूल्यांकन की सीमाओं जैसे अत्यधिक कठोर यूनिट परीक्षण, अस्पष्ट प्रश्न विवरण और विकास वातावरण के कठिन सेटअप की समस्याओं को हल करना है। नए बेंचमार्क ने कंटेनराइज्ड Docker वातावरण को पेश करने के द्वारा मूल्यांकन की निरंतरता और विश्वसनीयता को बढ़ाया है, जिससे AI मॉडल की प्रदर्शन रेटिंग में महत्वपूर्ण सुधार हुआ है। GPT-4o ने नए बेंचमार्क के तहत 33.2% नमूनों का समाधान किया, जबकि सबसे अच्छा ओपन-सोर्स एजेंट ढांचा A
2024-08-13 08:34:48
.
AIbase
.
11.0k
दुनिया के सबसे शक्तिशाली AI प्रोग्रामर 'Genie' का आगमन, Devin और GPT-4 को हराया!
AI स्टार्टअप Cognition ने AI प्रोग्रामर 'Genie' लॉन्च किया, जिसने प्रतिष्ठित परीक्षण प्लेटफ़ॉर्म SWE-Bench पर 30.08% स्कोर किया, जो Devin और GPT-4 से कहीं अधिक है, और यह दुनिया का सबसे शक्तिशाली AI प्रोग्रामिंग सहायक बन गया। Genie के सह-संस्थापक Alistair Pullen ने 2022 में इस परियोजना का प्रदर्शन किया, जिसका उद्देश्य ऐसी AI बनाना है जो मानवों की तरह स्वचालित रूप से कोडिंग, डिबगिंग और ऑप्टिमाइजेशन कर सके। डेवलपमेंट के एक साल बाद, Genie एक विशेष डेटा का उपयोग करता है जिसमें मानव प्रोग्रामरों की तर्क करने की प्रक्रिया शामिल है।