प्रोग्राम विकास की दुनिया में, त्रुटि सुधार हमेशा से एक सिरदर्द का विषय रहा है। अब, बाइटडांस के डौबाओ बड़े मॉडल टीम ने इसके लिए अच्छी खबर लाई है: उन्होंने आधिकारिक तौर पर पहला बहुभाषी सॉफ्टवेयर इंजीनियरिंग (SWE) डेटासेट - Multi-SWE-bench लॉन्च किया है। इस नए डेटासेट का उद्देश्य बड़े मॉडल की कोड त्रुटियों को स्वचालित रूप से ठीक करने की क्षमता का मूल्यांकन और सुधार करना है।
Multi-SWE-bench पिछले एकल भाषा डेटासेट की तुलना में, आवेदन की गुंजाइश में उल्लेखनीय रूप से विस्तार करता है। यह डेटासेट न केवल पायथन को शामिल करता है, बल्कि जावा, गो, रस्ट, सी, सी++, टाइपस्क्रिप्ट और जावास्क्रिप्ट जैसी सात मुख्य प्रोग्रामिंग भाषाओं को भी शामिल करता है, जो वास्तव में "पूर्ण स्टैक इंजीनियरिंग" के मूल्यांकन मानदंड को प्राप्त करता है। इसका मतलब है कि चाहे डेवलपर किसी भी भाषा का उपयोग करे, वह इससे लाभान्वित हो सकता है।
डेटासेट के निर्माण की प्रक्रिया भी ध्यान देने योग्य है। Multi-SWE-bench में 1632 वास्तविक प्रोग्रामिंग उदाहरण शामिल हैं, सभी उदाहरण GitHub पर समस्या प्रतिक्रिया से प्राप्त हुए हैं। गुणवत्ता सुनिश्चित करने के लिए, इन उदाहरणों को एकीकृत परीक्षण मानकों और पेशेवर डेवलपर्स द्वारा समीक्षा और छंटाई की गई है, यह सुनिश्चित करते हुए कि प्रत्येक नमूने में स्पष्ट समस्या विवरण, प्रभावी सुधार पैच और प्रजनन योग्य परीक्षण वातावरण हो।
डौबाओ बड़े मॉडल टीम को उम्मीद है कि इस नए डेटासेट के माध्यम से, विभिन्न मुख्य प्रोग्रामिंग भाषाओं और वास्तविक कोड वातावरण में बड़े मॉडल के व्यवस्थित मूल्यांकन को आगे बढ़ाया जा सकेगा, जिससे उनकी स्वचालित प्रोग्रामिंग क्षमता में सुधार होगा, और अधिक व्यावहारिक और इंजीनियरिंग-उन्मुख दिशा में विकास होगा। यह प्रयास न केवल डेवलपर्स के समय की बचत में मदद करेगा, बल्कि सॉफ्टवेयर विकास की दक्षता और गुणवत्ता में भी सुधार करेगा।
वास्तविक विकास में, त्रुटि सुधार केवल एक तकनीकी समस्या नहीं है, बल्कि परियोजना की प्रगति और टीम के मनोबल को प्रभावित करने वाला एक महत्वपूर्ण कारक भी है। इसलिए, Multi-SWE-bench का शुभारंभ भविष्य के स्वचालित सॉफ्टवेयर इंजीनियरिंग में एक महत्वपूर्ण कदम हो सकता है।
बाइटडांस का यह नया डेटासेट कोड स्वचालित सुधार तकनीक में एक महत्वपूर्ण कदम का प्रतीक है, जो व्यापक डेवलपर्स के लिए सुविधा लाने की उम्मीद करता है।