2024 में विश्व आर्टिफिशियल इंटेलिजेंस सम्मेलन में, SenseTime ने देश का पहला "दैनिक नया 5o" मॉडल पेश किया, जो कि वीजुअल-टू-वीज़ुअल मॉडल है। इस मॉडल का इंटरैक्शन अनुभव GPT-4o के समान है, जो वास्तविक समय में स्ट्रीमिंग मल्टी-मोडल इंटरैक्शन को सक्षम बनाता है। यह मॉडल ध्वनि, पाठ, छवि और वीडियो जैसी क्रॉस-मोडल जानकारी को एकीकृत करके वास्तविक समय में समझ और प्रतिक्रिया करने में सक्षम है। उदाहरण के लिए, यह कर्मचारियों द्वारा पहने गए आईडी कार्ड की पहचान कर सकता है और सम्मेलन स्थल का स्थान निर्धारित कर सकता है, छोटे कुत्ते के खिलौने की उपस्थिति और पहनावे का वर्णन कर सकता है, और कर्मचारियों द्वारा बनाए गए चित्रों का तात्कालिक मूल्यांकन कर सकता है।
“दैनिक नया 5o” मॉडल की वास्तविक समय इंटरैक्शन क्षमता विशेष रूप से वास्तविक समय की बातचीत और वॉयस रिकग्निशन जैसे अनुप्रयोगों के लिए उपयुक्त है, यह एक ही मॉडल में कई कार्यों को संभाल सकता है और विभिन्न संदर्भों के अनुसार अपने व्यवहार और आउटपुट को स्वचालित रूप से समायोजित कर सकता है। यह मॉडल "दैनिक नया 5.5" आधार मॉडल पर आधारित है, जबकि "दैनिक नया 5.5" इस वर्ष अप्रैल में जारी किए गए "दैनिक नया 5.0" का उन्नत संस्करण है, जिसमें समग्र प्रदर्शन में औसतन 30% की वृद्धि हुई है, विशेष रूप से गणितीय तर्क, अंग्रेजी क्षमता और निर्देशों का पालन करने में महत्वपूर्ण सुधार हुआ है।
“दैनिक नया 5.5” ने हाइब्रिड एंड-ऑन-फॉग सहयोगी विशेषज्ञ आर्किटेक्चर को अपनाया है, जिसमें 10TB से अधिक उच्च गुणवत्ता वाले प्रशिक्षण डेटा, जिसमें सिंथेटिक थिंकिंग चेन डेटा शामिल है, का उपयोग करके मॉडल की तर्कशीलता को बढ़ाया गया है। व्यापार उपयोगकर्ताओं के लिए प्रवेश बाधाओं को कम करने के लिए, SenseTime ने "बड़े मॉडल 0 रुपये Go" योजना शुरू की है, जो नए पंजीकृत उपयोगकर्ताओं को कई मुफ्त सेवाएं प्रदान करती है और 50 मिलियन Tokens पैक भेंट करती है, साथ ही OpenAI उपयोगकर्ताओं को स्थानांतरित करने में मदद करने के लिए विशेष स्थानांतरण सलाहकार प्रदान करती है, जिससे शून्य सेवा लागत प्राप्त होती है।