2024 में विश्व आर्टिफिशियल इंटेलिजेंस सम्मेलन में, SenseTime ने देश का पहला "दैनिक नया 5o" मॉडल पेश किया, जो कि वीजुअल-टू-वीज़ुअल मॉडल है। इस मॉडल का इंटरैक्शन अनुभव GPT-4o के समान है, जो वास्तविक समय में स्ट्रीमिंग मल्टी-मोडल इंटरैक्शन को सक्षम बनाता है। यह मॉडल ध्वनि, पाठ, छवि और वीडियो जैसी क्रॉस-मोडल जानकारी को एकीकृत करके वास्तविक समय में समझ और प्रतिक्रिया करने में सक्षम है। उदाहरण के लिए, यह कर्मचारियों द्वारा पहने गए आईडी कार्ड की पहचान कर सकता है और सम्मेलन स्थल का स्थान निर्धारित कर सकता है, छोटे कुत्ते के खिलौने की उपस्थिति और पहनावे का वर्णन कर सकता है, और कर्मचारियों द्वारा बनाए गए चित्रों का तात्कालिक मूल्यांकन कर सकता है।

微信截图_20240705134314.png

“दैनिक नया 5o” मॉडल की वास्तविक समय इंटरैक्शन क्षमता विशेष रूप से वास्तविक समय की बातचीत और वॉयस रिकग्निशन जैसे अनुप्रयोगों के लिए उपयुक्त है, यह एक ही मॉडल में कई कार्यों को संभाल सकता है और विभिन्न संदर्भों के अनुसार अपने व्यवहार और आउटपुट को स्वचालित रूप से समायोजित कर सकता है। यह मॉडल "दैनिक नया 5.5" आधार मॉडल पर आधारित है, जबकि "दैनिक नया 5.5" इस वर्ष अप्रैल में जारी किए गए "दैनिक नया 5.0" का उन्नत संस्करण है, जिसमें समग्र प्रदर्शन में औसतन 30% की वृद्धि हुई है, विशेष रूप से गणितीय तर्क, अंग्रेजी क्षमता और निर्देशों का पालन करने में महत्वपूर्ण सुधार हुआ है।

“दैनिक नया 5.5” ने हाइब्रिड एंड-ऑन-फॉग सहयोगी विशेषज्ञ आर्किटेक्चर को अपनाया है, जिसमें 10TB से अधिक उच्च गुणवत्ता वाले प्रशिक्षण डेटा, जिसमें सिंथेटिक थिंकिंग चेन डेटा शामिल है, का उपयोग करके मॉडल की तर्कशीलता को बढ़ाया गया है। व्यापार उपयोगकर्ताओं के लिए प्रवेश बाधाओं को कम करने के लिए, SenseTime ने "बड़े मॉडल 0 रुपये Go" योजना शुरू की है, जो नए पंजीकृत उपयोगकर्ताओं को कई मुफ्त सेवाएं प्रदान करती है और 50 मिलियन Tokens पैक भेंट करती है, साथ ही OpenAI उपयोगकर्ताओं को स्थानांतरित करने में मदद करने के लिए विशेष स्थानांतरण सलाहकार प्रदान करती है, जिससे शून्य सेवा लागत प्राप्त होती है।