智谱 ने GLM-4-9B श्रृंखला मॉडल लॉन्च करने की घोषणा की है, जिसमें बेस मॉडल, विभिन्न संदर्भ लंबाई के चैट मॉडल और दृश्य मॉडल शामिल हैं, जो LLaMA38B की तुलना में पूरी तरह से सक्षम हैं। ज्ञात हुआ है कि GLM-4-9B श्रृंखला मॉडल GitHub पर ओपन-सोर्स किया गया है, जिससे कई डेवलपर्स और शोधकर्ताओं का ध्यान आकर्षित हुआ है। इस श्रृंखला के मॉडल का विमोचन智谱 कंपनी के लिए कृत्रिम बुद्धिमत्ता के क्षेत्र में एक और महत्वपूर्ण突破 माना जाता है।

image.png

GLM-4-9B智谱 AI द्वारा पेश किया गया नवीनतम पीढ़ी का प्री-ट्रेंड मॉडल GLM-4 श्रृंखला में ओपन-सोर्स संस्करण है। अर्थ, गणित, तर्क, कोड और ज्ञान जैसे विभिन्न डेटा सेट परीक्षणों में, GLM-4-9B और इसके मानव प्राथमिकता संरेखित संस्करण GLM-4-9B-Chat दोनों ने Llama-3-8B की तुलना में उत्कृष्ट प्रदर्शन दिखाया है।

image.png

बहु-चरण संवाद करने के अलावा, GLM-4-9B-Chat में वेब ब्राउज़िंग, कोड निष्पादन, कस्टम टूल कॉल (फंक्शन कॉल) और लंबी पाठ की तर्कशक्ति (अधिकतम 128K संदर्भ का समर्थन) जैसी उन्नत क्षमताएँ भी हैं।

इस पीढ़ी के मॉडल में बहु-भाषा समर्थन जोड़ा गया है, जिसमें जापानी, कोरियाई, जर्मन सहित 26 भाषाओं का समर्थन है। हमने 1M संदर्भ लंबाई (लगभग 2000000 चीनी वर्ण) का समर्थन करने वाला GLM-4-9B-Chat-1M मॉडल और GLM-4-9B पर आधारित मल्टी-मोडल मॉडल GLM-4V-9B भी लॉन्च किया है।

GLM-4V-9B 1120*1120 उच्च संकल्प में चीनी और अंग्रेजी दोनों भाषाओं में बहु-चरण संवाद क्षमता प्रदान करता है, और चीनी और अंग्रेजी की समग्र क्षमता, संवेदनशील तर्क, पाठ पहचान, चार्ट समझने जैसी कई मल्टी-मोडल परीक्षणों में, GLM-4V-9B ने GPT-4-turbo-2024-04-09, Gemini1.0Pro, Qwen-VL-Max और Claude3Opus की तुलना में उत्कृष्ट प्रदर्शन किया है।

नेटिज़न्स ने कहा है कि वे उम्मीद करते हैं कि GLM-4-9B श्रृंखला मॉडल कृत्रिम बुद्धिमत्ता प्रौद्योगिकी के विकास में नई गति लाएगी और अधिक स्मार्ट उत्पादों के आने की उम्मीद कर रहे हैं। साथ ही, उन्होंने智谱 कंपनी की तकनीकी क्षमता और नवाचार क्षमता की सराहना की है।

ओपन-सोर्स पता: https://github.com/THUDM/GLM-4

मॉडल अनुभव पता: https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary