हांगकांग चाइनीज यूनिवर्सिटी (शेन्ज़ेन) और शेन्ज़ेन बिग डेटा रिसर्च इंस्टीट्यूट की शोध टीम ने हाल ही में HuatuoGPT-o1 नामक एक चिकित्सा बड़े भाषा मॉडल (LLM) जारी किया है। यह मॉडल चिकित्सा क्षेत्र की जटिल तर्क प्रक्रिया के लिए विशेष रूप से डिज़ाइन किया गया है, जिसका उद्देश्य चिकित्सा निदान और निर्णय की विश्वसनीयता को बढ़ाना है। पिछले LLM के विपरीत, जो गणितीय तर्क पर केंद्रित थे, HuatuoGPT-o1 चिकित्सा के इस विशेष क्षेत्र पर ध्यान केंद्रित करता है, वास्तविक कार्य में चिकित्सकों की गंभीर सोच प्रक्रिया का अनुकरण करके चिकित्सा AI के विकास के लिए नए रास्ते खोलता है।
शोध टीम ने पहचाना कि चिकित्सा क्षेत्र में तर्क प्रक्रिया अक्सर स्पष्ट चरणों की कमी होती है, जिससे सत्यापन करना मुश्किल होता है। इस समस्या को हल करने के लिए, उन्होंने चिकित्सा परीक्षा प्रश्न बैंक से 40,000 कठिन प्रश्नों का चयन किया, जिनके पास एक अद्वितीय, वस्तुनिष्ठ सही उत्तर था, और उन्हें ओपन-एंडेड प्रश्नों में परिवर्तित किया, जिससे सत्यापनीय चिकित्सा प्रश्नों का सेट बनाया गया। ये प्रश्न न केवल मॉडल को गहन तर्क करने की आवश्यकता होती है, बल्कि उत्तरों की सही या गलतता के माध्यम से तर्क प्रक्रिया की सत्यता को भी सत्यापित करते हैं।
शोध टीम ने मॉडल की तर्क क्षमता को बढ़ाने के लिए एक दो-चरणीय प्रशिक्षण विधि का उपयोग किया। पहले चरण में, सत्यापनकर्ता की प्रतिक्रिया (सही या गलत) का उपयोग करके मॉडल को रणनीति-आधारित खोज के लिए मार्गदर्शन किया गया, जिससे जटिल तर्क पथ उत्पन्न होते हैं। मॉडल पहले एक सोच श्रृंखला (CoT) को प्रारंभ करता है, यदि सत्यापनकर्ता मानता है कि वर्तमान CoT गलत है, तो मॉडल पीछे हटने, नए रास्तों की खोज, सत्यापन या सुधार जैसे रणनीतियों का प्रयास करता है, जब तक सही उत्तर नहीं मिलता। ये सफल तर्क पथ बाद में LLM को सूक्ष्म-समायोजित करने के लिए उपयोग किए जाते हैं, जिससे इसमें पुनरावृत्त विचार करने की जटिल तर्क क्षमता होती है। दूसरे चरण में, सत्यापनकर्ता द्वारा प्रदान किए गए विरल पुरस्कार का उपयोग करके, सुदृढीकरण सीखने (RL) एल्गोरिदम के माध्यम से मॉडल की जटिल तर्क क्षमता को और बढ़ाया गया।
प्रयोगात्मक परिणामों से पता चलता है कि इस विधि ने केवल 40,000 सत्यापनीय प्रश्नों का उपयोग करके 80 अरब पैरामीटर वाले मॉडल को चिकित्सा मानक परीक्षण में 8.5 अंक की वृद्धि प्राप्त करने में मदद की। और 700 अरब पैरामीटर वाले मॉडल ने कई चिकित्सा मानक परीक्षणों में अन्य ओपन-सोर्स सामान्य और चिकित्सा विशेष LLM को भी पार कर लिया। ये परिणाम जटिल तर्क की चिकित्सा समस्याओं को हल करने में प्रभावशीलता और मॉडल प्रदर्शन को बढ़ाने में सुदृढीकरण सीखने की महत्वपूर्ण भूमिका की पुष्टि करते हैं।
HuatuoGPT-o1 की नवीनता यह है कि यह पहली बार सत्यापनीय चिकित्सा प्रश्नों और चिकित्सा सत्यापनकर्ता का उपयोग करके LLM की चिकित्सा जटिल तर्क क्षमता को बढ़ाता है। इस विधि के माध्यम से, मॉडल चिकित्सकों की तरह गहन विचार कर सकता है और उत्तर देने से पहले आत्म-सत्यापन और सुधार कर सकता है। इससे न केवल चिकित्सा क्षेत्र में मॉडल के अनुप्रयोग की संभावनाएं बढ़ी हैं, बल्कि अन्य पेशेवर क्षेत्रों में तर्क क्षमता को बढ़ाने के लिए भी एक उदाहरण प्रस्तुत किया गया है।
मॉडल की विश्वसनीयता को सत्यापित करने के लिए, शोधकर्ताओं ने GPT-4o को सत्यापनकर्ता के रूप में उपयोग किया, और परिणाम दर्शाते हैं कि पहले चरण में इसकी सटीकता 96.5% तक पहुंच गई, जबकि दूसरे चरण में इसकी सटीकता 94.5% रही। साथ ही, उन्होंने यह भी प्रमाणित किया कि LLM आधारित सत्यापनकर्ता पारंपरिक सटीक मिलान विधियों की तुलना में अधिक विश्वसनीय है। इसके अतिरिक्त, शोधकर्ताओं ने इस विधि को चीनी चिकित्सा क्षेत्र में भी लागू किया और समान रूप से महत्वपूर्ण परिणाम प्राप्त किए, जो विभिन्न क्षेत्रों और भाषा परिवेशों में इस विधि की अनुकूलता को साबित करता है।
कुल मिलाकर, HuatuoGPT-o1 की उपस्थिति चिकित्सा AI में जटिल तर्क के क्षेत्र में महत्वपूर्ण प्रगति का संकेत देती है। यह न केवल चिकित्सा निदान और निर्णय के लिए एक अधिक विश्वसनीय उपकरण प्रदान करता है, बल्कि भविष्य में अन्य पेशेवर क्षेत्रों में AI के अनुप्रयोग के लिए नए विचार भी प्रस्तुत करता है। हालांकि, यह मॉडल वर्तमान में शोध चरण में है और इसे सीधे नैदानिक उपयोग के लिए लागू नहीं किया जा सकता है, लेकिन इसकी विशाल संभावनाएं व्यापक ध्यान आकर्षित कर चुकी हैं।
पत्र का पता: https://arxiv.org/pdf/2412.18925