智谱发布GLM-4-Air、GLM-4V-Plus模型设立Flash全模态免费模型

बीजिंग झीपु हुआझांग प्रौद्योगिकी有限公司 ने 2025年1月16日 को एक नई श्रृंखला के मॉडल लॉन्च करने की घोषणा की, जो bigmodel.cn पर उपलब्ध हैं। अगस्त में "झीपु क्लींगन" के लॉन्च के बाद, कंपनी ने भाषा, आवाज, छवि और वीडियो की समझ और उत्पादन के क्षेत्र में गहरी खोज की, जिसमें GLM-Voice, GLM-4V, CogView, CogVideoX जैसे बहु-मोडल मॉडल शामिल हैं।

इस बार जारी किया गया नया एंड-टू-एंड मॉडल GLM-Realtime, कम विलंबता वाले वीडियो समझ और आवाज इंटरैक्शन को सक्षम बनाता है, जिसमें एक क्लींग गाने की क्षमता शामिल है और यह 2 मिनट की याददाश्त और फ़ंक्शन कॉल फ़ंक्शन का समर्थन करता है। कंपनी ने GLM-4-Air और GLM-4V-Plus मॉडल को भी अपडेट किया है, जो उद्योग में सबसे मजबूत प्रदर्शन और मूल्य-प्रदर्शन समाधान प्रदान करने के लिए प्रतिबद्ध है। झीपु हमेशा उन्नत बड़े मॉडल तकनीक के माध्यम से समाज को वापस देने के लिए प्रतिबद्ध है, विशेष रूप से Flash पूर्ण-मोडल मुफ्त मॉडल की स्थापना की है, जो भाषा, टेक्स्ट-से-इमेज, टेक्स्ट-से-वीडियो और छवि समझ सहित कई दृश्य को कवर करता है, जिससे डेवलपर्स को अनुप्रयोग नवाचार में आसानी होती है।

微信截图_20250116150923.png

GLM-Realtime वीडियो कॉल में 2 मिनट की सामग्री याद रखने की क्षमता रखता है, और आवाज इंटरैक्शन में क्लींग गाने की क्षमता को नवाचार के साथ लागू करता है, जिससे बड़े मॉडल को बातचीत में गाने की क्षमता मिलती है। कंपनी ने Realtime API को स्मार्ट चश्मे और साथी गुड़िया में एकीकृत किया है ताकि उपयोगकर्ता लगभग वास्तविक समय के स्मार्ट सहायक इंटरैक्शन का अनुभव कर सकें। Realtime फ़ंक्शन कॉल फ़ंक्शन का भी समर्थन करता है, जो अपने ज्ञान और क्षमताओं पर निर्भर करते हुए बाहरी ज्ञान और उपकरणों को लचीले ढंग से कॉल कर सकता है, और इसे व्यापक व्यापार परिदृश्यों में विस्तारित कर सकता है। GLM-Realtime API अब झीपु ओपन प्लेटफ़ॉर्म bigmodel.cn पर उपलब्ध है और वर्तमान में इसे मुफ्त में कॉल किया जा सकता है।

GLM-4-Air को लॉन्च के बाद से उच्च मूल्य-प्रदर्शन के लिए डेवलपर्स द्वारा पसंद किया गया है, और इसे GLM-4-Air-0111 में पूरी तरह से अपग्रेड किया गया है, जिसमें प्रशिक्षण डेटा और प्रक्रियाओं का अनुकूलन किया गया है, जिससे कुछ आयामों में प्रदर्शन बड़े GLM-4-Plus के करीब हो गया है, जबकि मॉडल की कीमत को पहले के 50% तक घटा दिया गया है, जिससे बड़े मॉडल के अनुप्रयोग की बाधाओं को कम किया जा सके। दृश्य समझ मॉडल GLM-4V-Plus को भी पूरी तरह से अपग्रेड किया गया है, नया संस्करण कई सार्वजनिक सूचियों पर प्रभावी रूप से सुधार करता है, जो विभिन्न आकार की छवि इनपुट के लिए परिवर्तनशील रिज़ॉल्यूशन फ़ंक्शन का समर्थन करता है, छोटे चित्र दृश्य में टोकन खपत को महत्वपूर्ण रूप से कम करता है, 4K अल्ट्रा-एचडी चित्रों और अत्यधिक लंबाई-चौड़ाई वाले चित्रों की बिना हानि पहचान का समर्थन करता है, और 2 घंटे तक वीडियो समझने की क्षमता रखता है, लंबे वीडियो की समझ और विश्लेषण के लिए कुशल और सटीक समाधान प्रदान करता है।

झीपु बड़े मॉडल की व्यापकता के लिए प्रतिबद्ध है, डेवलपर्स के नवाचार में मदद करने के लिए, समाज के लिए मुफ्त में खोलने के लिए Flash श्रृंखला के सामान्य मॉडल API की स्थापना की है। उद्योग का पहला पूर्ण-मोडल मुफ्त श्रृंखला मॉडल के रूप में, डेवलपर्स मुफ्त में भाषा, बहु-मोडल समझ और बहु-मोडल उत्पादन कार्यक्षमता को कॉल कर सकते हैं। हाल ही में Flash श्रृंखला को पूरी तरह से अपग्रेड किया जाएगा, जिसमें भाषा मॉडल GLM-4-Flash, छवि समझ मॉडल GLM-4V-Flash, छवि उत्पादन मॉडल CogView-3-Flash, और वीडियो उत्पादन मॉडल CogVideoX-Flash शामिल हैं।

AI समाचार

智谱发布GLM-4-Air、GLM-4V-Plus模型设立Flash全模态免费模型

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

चीतूप खुला स्रोत पाठ-से-चित्र मॉडल CogView4 चीनी और अंग्रेजी दोनों भाषाओं में संकेत शब्दों का समर्थन करता है

चीज़ू ने पहला खुला स्रोत पाठ-से-चित्र मॉडल CogView4 जारी किया जो चीनी वर्ण उत्पन्न कर सकता है

智पु与中国三星 ने战略合作 की घोषणा की: AI मोबाइल领域 में गहन सहयोग

AI समाचार

智谱发布GLM-4-Air、GLM-4V-Plus模型 设立Flash全模态免费模型

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

चीतूप खुला स्रोत पाठ-से-चित्र मॉडल CogView4 चीनी और अंग्रेजी दोनों भाषाओं में संकेत शब्दों का समर्थन करता है

चीज़ू ने पहला खुला स्रोत पाठ-से-चित्र मॉडल CogView4 जारी किया जो चीनी वर्ण उत्पन्न कर सकता है

智पु与中国三星 ने战略合作 की घोषणा की: AI मोबाइल领域 में गहन सहयोग

智谱发布GLM-4-Air、GLM-4V-Plus模型设立Flash全模态免费模型