智譜は、GLM-4-9Bシリーズモデルを発表しました。このシリーズには、ベースモデル、様々なコンテキスト長のチャットモデル、ビジョンモデルが含まれており、LLaMA38Bを凌駕する能力を備えています。GLM-4-9BシリーズモデルはGitHubでオープンソース化されており、多くの開発者や研究者の注目を集めています。このシリーズモデルの発表は、智譜社の人工知能分野における大きな進歩と見なされています。
GLM-4-9Bは、智譜AIが発表した最新世代の事前学習モデルGLM-4シリーズのオープンソース版です。意味、数学、推論、コード、知識など多様なデータセットの評価において、GLM-4-9Bと、そのヒューマン・イン・ザ・ループによる調整版であるGLM-4-9B-Chatは、Llama-3-8Bを上回る優れた性能を示しました。
GLM-4-9B-Chatは、複数回にわたる対話に加え、ウェブブラウジング、コード実行、カスタムツール呼び出し(Function Call)、長文推論(最大128Kコンテキストをサポート)などの高度な機能を備えています。
今回のモデルでは多言語サポートが強化され、日本語、韓国語、ドイツ語を含む26言語に対応しています。また、1Mコンテキスト長(約200万文字)をサポートするGLM-4-9B-Chat-1Mモデルと、GLM-4-9BベースのマルチモーダルモデルGLM-4V-9Bも発表しました。
GLM-4V-9Bは、1120*1120の高解像度で中国語と英語の両言語による複数回にわたる対話能力を備え、中国語と英語の総合能力、知覚推論、文字認識、グラフ理解など、マルチモーダル評価において、GPT-4-turbo-2024-04-09、Gemini1.0Pro、Qwen-VL-Max、Claude3Opusを上回る優れた性能を示しました。
ネットユーザーからは、GLM-4-9Bシリーズモデルが人工知能技術の発展に新たな推進力を与え、より多くのインテリジェントな製品が登場することを期待する声が多数上がっています。同時に、智譜社の技術力と革新力に対する称賛の声も多数寄せられています。
オープンソースアドレス:https://github.com/THUDM/GLM-4
モデル体験アドレス:https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary