गूगल का जेमिनी मॉडल केवल छह महीने में, सुरक्षा, कोडिंग, डिबगिंग आदि क्षेत्रों में उल्लेखनीय क्षमताएँ दिखा चुका है, हालांकि, इसमें गंभीर सीमाएँ भी हैं। फिर भी, यह बड़ा भाषा मॉडल (LLM) नींद और फिटनेस सुझावों में मानव से बेहतर है।
गूगल के शोधकर्ताओं ने व्यक्तिगत स्वास्थ्य बड़े भाषा मॉडल (PH-LLM) को लॉन्च किया है, जो जेमिनी का एक परिष्कृत संस्करण है, जो पहनने योग्य उपकरणों (जैसे स्मार्टवॉच और हार्ट रेट मॉनिटर्स) से समय-श्रृंखला व्यक्तिगत स्वास्थ्य डेटा को समझने और तर्क करने में सक्षम है। उनके प्रयोगों में, इस मॉडल ने स्वास्थ्य और फिटनेस के क्षेत्र में वर्षों के अनुभव वाले विशेषज्ञों की तुलना में प्रश्नों के उत्तर और भविष्यवाणियों में स्पष्ट रूप से बेहतर प्रदर्शन किया।
पहनने योग्य तकनीक लोगों को उनके स्वास्थ्य की निगरानी करने में मदद कर सकती है और आदर्श रूप से महत्वपूर्ण बदलाव करने में मदद कर सकती है। ये उपकरण "समृद्ध और दीर्घकालिक डेटा स्रोत" प्रदान करते हैं, जो गतिविधि और आहार लॉग, मूड डायरी, और कभी-कभी सोशल मीडिया गतिविधियों जैसे इनपुट से "निष्क्रिय और निरंतर रूप से प्राप्त" होते हैं। हालांकि, वे जो नींद, शारीरिक गतिविधि, हृदय मेटाबॉलिक स्वास्थ्य और तनाव के बारे में डेटा कैप्चर करते हैं, वह "विखंडित" क्लिनिकल वातावरण में बहुत कम शामिल किया जाता है। शोधकर्ताओं का अनुमान है कि यह संभवतः डेटा कैप्चर करते समय संदर्भ की कमी के कारण है, और इसे स्टोर और विश्लेषण करने के लिए भारी गणना की आवश्यकता होती है। इसके अलावा, इन डेटा की व्याख्या करना भी कठिन हो सकता है।
हालांकि, गूगल के शोधकर्ताओं ने PH-LLM मॉडल को सलाह देने, पेशेवर परीक्षा प्रश्नों का उत्तर देने और आत्म-रिपोर्ट की गई नींद में बाधा और नींद विकार के परिणामों की भविष्यवाणी करने के लिए प्रशिक्षित करने में महत्वपूर्ण प्रगति की है। इस मॉडल को बहुविकल्पीय प्रश्न दिए गए, और शोधकर्ताओं ने "चिंतन श्रृंखला" (मानव तर्क की नकल करना) और "ज़ीरो-शॉट" विधियों (पहले कभी नहीं देखे गए वस्तुओं और अवधारणाओं की पहचान) का उपयोग किया।
प्रभावशाली रूप से, PH-LLM ने नींद परीक्षा में 79% और फिटनेस परीक्षा में 88% अंक प्राप्त किए, जो कि एक नमूना मानव विशेषज्ञ समूह के औसत स्कोर से अधिक हैं, जिसमें पांच पेशेवर खेल प्रशिक्षक (औसत अनुभव 13.8 वर्ष) और पांच नींद चिकित्सा विशेषज्ञ (औसत अनुभव 25 वर्ष) शामिल हैं। मानव विशेषज्ञों के औसत स्कोर नींद और फिटनेस में क्रमशः 71% और 76% थे।
शोधकर्ताओं ने कहा: "हालांकि व्यक्तिगत स्वास्थ्य क्षेत्र में आगे विकास और मूल्यांकन कार्य की आवश्यकता है, ये परिणाम जेमिनी मॉडल के व्यापक ज्ञान आधार और क्षमताओं को साबित करते हैं।"
इन परिणामों को प्राप्त करने के लिए, शोधकर्ताओं ने पहले तीन डेटा सेट बनाए और व्यवस्थित किए, जो पहनने योग्य उपकरणों से व्यक्तिगत अंतर्दृष्टि और सुझाव, विशेषज्ञता ज्ञान और आत्म-रिपोर्ट की गई नींद की गुणवत्ता की भविष्यवाणियों का परीक्षण करने के लिए थे। उन्होंने क्षेत्र के विशेषज्ञों के साथ मिलकर 857 केस स्टडीज बनाई, जो नींद और फिटनेस के क्षेत्र में वास्तविक परिदृश्यों का प्रतिनिधित्व करती हैं। नींद के परिदृश्यों ने संभावित कारकों की पहचान करने के लिए व्यक्तिगत संकेतकों का उपयोग किया और नींद की गुणवत्ता में सुधार करने के लिए व्यक्तिगत सुझाव प्रदान किए। फिटनेस कार्यों ने प्रशिक्षण, नींद, स्वास्थ्य संकेतक और उपयोगकर्ता फीडबैक से जानकारी का उपयोग करते हुए किसी एक दिन के लिए शारीरिक गतिविधि की तीव्रता के लिए सुझाव तैयार किए।
दोनों प्रकार की केस स्टडीज में पहनने योग्य सेंसर डेटा शामिल थे, जिसमें नींद डेटा 29 दिनों तक, फिटनेस डेटा 30 दिनों से अधिक, और जनसांख्यिकी जानकारी (उम्र और लिंग) और विशेषज्ञ विश्लेषण शामिल थे।
हालांकि शोधकर्ताओं ने ध्यान दिया कि PH-LLM केवल एक शुरुआत है, किसी भी उभरती हुई तकनीक की तरह, इसमें कुछ समस्याएँ हल करने की आवश्यकता है। उदाहरण के लिए, मॉडल द्वारा उत्पन्न उत्तर हमेशा सुसंगत नहीं होते, केस स्टडी में "महत्वपूर्ण भिन्नता" की कल्पना होती है, और LLM कभी-कभी उत्तर देने में सतर्क या सावधान प्रतीत होता है। फिटनेस केस स्टडी में, इस मॉडल ने ओवरट्रेनिंग के प्रति बहुत संवेदनशीलता दिखाई, और एक केस में, मानव विशेषज्ञ ने देखा कि यह नींद की कमी के संभावित कारणों की पहचान करने में विफल रहा। इसके अलावा, केस स्टडी ने विभिन्न जनसांख्यिकी डेटा और अपेक्षाकृत सक्रिय व्यक्तियों को व्यापक रूप से कवर किया, इसलिए यह जनसंख्या का पूरी तरह से प्रतिनिधित्व नहीं कर सकती है और न ही व्यापक नींद और फिटनेस समस्याओं को संबोधित कर सकती है।