दवा विकास एक जटिल और महँगा प्रक्रिया है, जिसमें उच्च विफलता दर और लंबा विकास चक्र शामिल है। पारंपरिक दवा खोज प्रक्रिया में लक्ष्य पहचान से लेकर नैदानिक ​​परीक्षणों के विभिन्न चरणों तक बड़े पैमाने पर प्रयोगात्मक सत्यापन की आवश्यकता होती है, जो अक्सर बहुत समय और संसाधन लेता है। हालाँकि, कम्प्यूटेशनल विधियों, विशेष रूप से मशीन लर्निंग और भविष्य कहनेवाला मॉडलिंग के उदय के साथ, इस प्रक्रिया को अनुकूलित करने की उम्मीद है।

QQ_1743143512429.png

वर्तमान कम्प्यूटेशनल मॉडल की विभिन्न उपचार कार्यों में सीमाओं का समाधान करने के लिए, Google AI ने TxGemma लॉन्च किया है, जो दवा विकास में विभिन्न उपचार कार्यों के लिए डिज़ाइन किया गया एक सामान्य बड़े पैमाने पर भाषा मॉडल (LLM) श्रृंखला है। TxGemma की विशिष्टता यह है कि इसमें विभिन्न क्षेत्रों के डेटासेट शामिल हैं, जिनमें छोटे अणु, प्रोटीन, न्यूक्लिक एसिड, रोग और सेल लाइन शामिल हैं, जिससे यह उपचार विकास प्रक्रिया के कई चरणों को कवर कर सकता है। यह मॉडल श्रृंखला 2 करोड़ (2B), 9 करोड़ (9B) और 27 करोड़ (27B) पैरामीटर विकल्प प्रदान करती है, जो सभी Gemma-2 आर्किटेक्चर पर आधारित हैं और व्यापक उपचार डेटासेट पर पूरी तरह से फाइन-ट्यून किए गए हैं। इसके अतिरिक्त, TxGemma में एक इंटरैक्टिव संवाद मॉडल TxGemma-Chat भी शामिल है, जिसके माध्यम से वैज्ञानिक विस्तृत चर्चा और तंत्र स्पष्टीकरण कर सकते हैं, जिससे मॉडल की पारदर्शिता में वृद्धि होती है।

तकनीकी दृष्टिकोण से, TxGemma ने उपचार डेटा समुदाय (TDC) का उपयोग किया है, जो 66 मिलियन डेटा बिंदुओं का एक व्यापक डेटासेट है। मॉडल श्रृंखला के भविष्य कहनेवाला संस्करण के रूप में, TxGemma-Predict इन डेटासेट पर उत्कृष्ट प्रदर्शन करता है, जिसका प्रदर्शन वर्तमान में उपचार मॉडलिंग में उपयोग किए जाने वाले सामान्य मॉडल और विशेष मॉडल के बराबर या उससे बेहतर है। उल्लेखनीय रूप से, TxGemma की फाइन-ट्यूनिंग विधि डेटा की कमी वाले क्षेत्रों में एक महत्वपूर्ण लाभ प्रदान करती है, क्योंकि यह प्रशिक्षण नमूनों की संख्या को कम करते हुए भविष्यवाणी सटीकता को अनुकूलित कर सकता है।

TxGemma की व्यावहारिकता नैदानिक ​​परीक्षणों में प्रतिकूल घटनाओं की भविष्यवाणी में पूरी तरह से प्रदर्शित होती है, जो उपचार सुरक्षा मूल्यांकन में एक महत्वपूर्ण कड़ी है। TxGemma-27B-Predict उत्कृष्ट भविष्य कहनेवाला प्रदर्शन दिखाता है, जबकि पारंपरिक मॉडल की तुलना में काफी कम प्रशिक्षण नमूनों का उपयोग करता है, जो इसकी डेटा दक्षता और विश्वसनीयता में सुधार को दर्शाता है। इसके अतिरिक्त, TxGemma की अनुमान गति वास्तविक समय के अनुप्रयोगों का समर्थन करती है, खासकर वर्चुअल स्क्रीनिंग जैसे परिदृश्यों में, जहाँ 27B पैरामीटर वाला मॉडल बड़े पैमाने पर नमूनों को कुशलतापूर्वक संभाल सकता है।

Google AI द्वारा लॉन्च किया गया TxGemma कम्प्यूटेशनल उपचार अनुसंधान में एक और महत्वपूर्ण प्रगति का प्रतीक है, जो भविष्य कहनेवाला दक्षता, इंटरैक्टिव अनुमान और डेटा दक्षता को जोड़ता है। TxGemma को सार्वजनिक करके, Google ने कई मालिकाना डेटासेट के आगे सत्यापन और अनुकूलन को संभव बनाया है, जिससे उपचार अनुसंधान की व्यापक अनुप्रयोग क्षमता और पुनरावृत्ति में वृद्धि हुई है।

मॉडल:https://huggingface.co/collections/google/txgemma-release-67dd92e931c857d15e4d1e87

मुख्य बातें:  

🌟 TxGemma Google AI द्वारा लॉन्च की गई एक सामान्य बड़े पैमाने पर भाषा मॉडल श्रृंखला है, जिसका उद्देश्य दवा विकास के विभिन्न उपचार कार्यों को अनुकूलित करना है।  

🔬 यह मॉडल श्रृंखला व्यापक डेटासेट को एकीकृत करती है, उत्कृष्ट प्रदर्शन करती है, विशेष रूप से नैदानिक ​​परीक्षणों में प्रतिकूल घटनाओं की भविष्यवाणी में।  

🚀 TxGemma की अनुमान गति वास्तविक समय के अनुप्रयोगों का समर्थन करती है, जिससे दवा विकास को शक्तिशाली कम्प्यूटेशनल समर्थन मिलता है।