ज़िज़िपू ओपन-सोर्स GLM-4-9B श्रृंखला मॉडल: क्षमताएँ LLaMA 3 8B से पूरी तरह से आगे

智谱 ने GLM-4-9B श्रृंखला मॉडल लॉन्च करने की घोषणा की है, जिसमें बेस मॉडल, विभिन्न संदर्भ लंबाई के चैट मॉडल और दृश्य मॉडल शामिल हैं, जो LLaMA38B की तुलना में पूरी तरह से सक्षम हैं। ज्ञात हुआ है कि GLM-4-9B श्रृंखला मॉडल GitHub पर ओपन-सोर्स किया गया है, जिससे कई डेवलपर्स और शोधकर्ताओं का ध्यान आकर्षित हुआ है। इस श्रृंखला के मॉडल का विमोचन智谱 कंपनी के लिए कृत्रिम बुद्धिमत्ता के क्षेत्र में एक और महत्वपूर्ण突破 माना जाता है।

GLM-4-9B智谱 AI द्वारा पेश किया गया नवीनतम पीढ़ी का प्री-ट्रेंड मॉडल GLM-4 श्रृंखला में ओपन-सोर्स संस्करण है। अर्थ, गणित, तर्क, कोड और ज्ञान जैसे विभिन्न डेटा सेट परीक्षणों में, GLM-4-9B और इसके मानव प्राथमिकता संरेखित संस्करण GLM-4-9B-Chat दोनों ने Llama-3-8B की तुलना में उत्कृष्ट प्रदर्शन दिखाया है।

बहु-चरण संवाद करने के अलावा, GLM-4-9B-Chat में वेब ब्राउज़िंग, कोड निष्पादन, कस्टम टूल कॉल (फंक्शन कॉल) और लंबी पाठ की तर्कशक्ति (अधिकतम 128K संदर्भ का समर्थन) जैसी उन्नत क्षमताएँ भी हैं।

इस पीढ़ी के मॉडल में बहु-भाषा समर्थन जोड़ा गया है, जिसमें जापानी, कोरियाई, जर्मन सहित 26 भाषाओं का समर्थन है। हमने 1M संदर्भ लंबाई (लगभग 2000000 चीनी वर्ण) का समर्थन करने वाला GLM-4-9B-Chat-1M मॉडल और GLM-4-9B पर आधारित मल्टी-मोडल मॉडल GLM-4V-9B भी लॉन्च किया है।

GLM-4V-9B 1120*1120 उच्च संकल्प में चीनी और अंग्रेजी दोनों भाषाओं में बहु-चरण संवाद क्षमता प्रदान करता है, और चीनी और अंग्रेजी की समग्र क्षमता, संवेदनशील तर्क, पाठ पहचान, चार्ट समझने जैसी कई मल्टी-मोडल परीक्षणों में, GLM-4V-9B ने GPT-4-turbo-2024-04-09, Gemini1.0Pro, Qwen-VL-Max और Claude3Opus की तुलना में उत्कृष्ट प्रदर्शन किया है।

नेटिज़न्स ने कहा है कि वे उम्मीद करते हैं कि GLM-4-9B श्रृंखला मॉडल कृत्रिम बुद्धिमत्ता प्रौद्योगिकी के विकास में नई गति लाएगी और अधिक स्मार्ट उत्पादों के आने की उम्मीद कर रहे हैं। साथ ही, उन्होंने智谱 कंपनी की तकनीकी क्षमता और नवाचार क्षमता की सराहना की है।

ओपन-सोर्स पता: https://github.com/THUDM/GLM-4

मॉडल अनुभव पता: https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary

AI समाचार

ज़िज़िपू ओपन-सोर्स GLM-4-9B श्रृंखला मॉडल: क्षमताएँ LLaMA 3 8B से पूरी तरह से आगे

AIbase

संबंधित AI समाचार अनुशंसाएँ

अली द्वारा ओपन-सोर्स बहुभाषी बड़ा भाषा मॉडल बेबेल, 25 भाषाओं का समर्थन करता है और दुनिया की 90% आबादी को सशक्त बनाता है

IBM ने लॉन्च किया छोटा AI मॉडल Granite 3.2, जो कि कुशलतापूर्वक तर्क और व्यावहारिकता पर केंद्रित है

अलीबाबा का नया ओपन-सोर्स अनुमान बड़ा मॉडल QwQ-32B, DeepSeek-R1 के बराबर प्रदर्शन, कम मेमोरी की आवश्यकता