बीजिंग झीपु हुआझांग प्रौद्योगिकी有限公司 ने 2025年1月16日 को एक नई श्रृंखला के मॉडल लॉन्च करने की घोषणा की, जो bigmodel.cn पर उपलब्ध हैं। अगस्त में "झीपु क्लींगन" के लॉन्च के बाद, कंपनी ने भाषा, आवाज, छवि और वीडियो की समझ और उत्पादन के क्षेत्र में गहरी खोज की, जिसमें GLM-Voice, GLM-4V, CogView, CogVideoX जैसे बहु-मोडल मॉडल शामिल हैं।

इस बार जारी किया गया नया एंड-टू-एंड मॉडल GLM-Realtime, कम विलंबता वाले वीडियो समझ और आवाज इंटरैक्शन को सक्षम बनाता है, जिसमें एक क्लींग गाने की क्षमता शामिल है और यह 2 मिनट की याददाश्त और फ़ंक्शन कॉल फ़ंक्शन का समर्थन करता है। कंपनी ने GLM-4-Air और GLM-4V-Plus मॉडल को भी अपडेट किया है, जो उद्योग में सबसे मजबूत प्रदर्शन और मूल्य-प्रदर्शन समाधान प्रदान करने के लिए प्रतिबद्ध है। झीपु हमेशा उन्नत बड़े मॉडल तकनीक के माध्यम से समाज को वापस देने के लिए प्रतिबद्ध है, विशेष रूप से Flash पूर्ण-मोडल मुफ्त मॉडल की स्थापना की है, जो भाषा, टेक्स्ट-से-इमेज, टेक्स्ट-से-वीडियो और छवि समझ सहित कई दृश्य को कवर करता है, जिससे डेवलपर्स को अनुप्रयोग नवाचार में आसानी होती है।

微信截图_20250116150923.png

GLM-Realtime वीडियो कॉल में 2 मिनट की सामग्री याद रखने की क्षमता रखता है, और आवाज इंटरैक्शन में क्लींग गाने की क्षमता को नवाचार के साथ लागू करता है, जिससे बड़े मॉडल को बातचीत में गाने की क्षमता मिलती है। कंपनी ने Realtime API को स्मार्ट चश्मे और साथी गुड़िया में एकीकृत किया है ताकि उपयोगकर्ता लगभग वास्तविक समय के स्मार्ट सहायक इंटरैक्शन का अनुभव कर सकें। Realtime फ़ंक्शन कॉल फ़ंक्शन का भी समर्थन करता है, जो अपने ज्ञान और क्षमताओं पर निर्भर करते हुए बाहरी ज्ञान और उपकरणों को लचीले ढंग से कॉल कर सकता है, और इसे व्यापक व्यापार परिदृश्यों में विस्तारित कर सकता है। GLM-Realtime API अब झीपु ओपन प्लेटफ़ॉर्म bigmodel.cn पर उपलब्ध है और वर्तमान में इसे मुफ्त में कॉल किया जा सकता है।

GLM-4-Air को लॉन्च के बाद से उच्च मूल्य-प्रदर्शन के लिए डेवलपर्स द्वारा पसंद किया गया है, और इसे GLM-4-Air-0111 में पूरी तरह से अपग्रेड किया गया है, जिसमें प्रशिक्षण डेटा और प्रक्रियाओं का अनुकूलन किया गया है, जिससे कुछ आयामों में प्रदर्शन बड़े GLM-4-Plus के करीब हो गया है, जबकि मॉडल की कीमत को पहले के 50% तक घटा दिया गया है, जिससे बड़े मॉडल के अनुप्रयोग की बाधाओं को कम किया जा सके। दृश्य समझ मॉडल GLM-4V-Plus को भी पूरी तरह से अपग्रेड किया गया है, नया संस्करण कई सार्वजनिक सूचियों पर प्रभावी रूप से सुधार करता है, जो विभिन्न आकार की छवि इनपुट के लिए परिवर्तनशील रिज़ॉल्यूशन फ़ंक्शन का समर्थन करता है, छोटे चित्र दृश्य में टोकन खपत को महत्वपूर्ण रूप से कम करता है, 4K अल्ट्रा-एचडी चित्रों और अत्यधिक लंबाई-चौड़ाई वाले चित्रों की बिना हानि पहचान का समर्थन करता है, और 2 घंटे तक वीडियो समझने की क्षमता रखता है, लंबे वीडियो की समझ और विश्लेषण के लिए कुशल और सटीक समाधान प्रदान करता है।

झीपु बड़े मॉडल की व्यापकता के लिए प्रतिबद्ध है, डेवलपर्स के नवाचार में मदद करने के लिए, समाज के लिए मुफ्त में खोलने के लिए Flash श्रृंखला के सामान्य मॉडल API की स्थापना की है। उद्योग का पहला पूर्ण-मोडल मुफ्त श्रृंखला मॉडल के रूप में, डेवलपर्स मुफ्त में भाषा, बहु-मोडल समझ और बहु-मोडल उत्पादन कार्यक्षमता को कॉल कर सकते हैं। हाल ही में Flash श्रृंखला को पूरी तरह से अपग्रेड किया जाएगा, जिसमें भाषा मॉडल GLM-4-Flash, छवि समझ मॉडल GLM-4V-Flash, छवि उत्पादन मॉडल CogView-3-Flash, और वीडियो उत्पादन मॉडल CogVideoX-Flash शामिल हैं।