人工知能(AI)分野において、大規模言語モデルの「幻覚問題」は長らく業界を悩ませてきた重要な課題です。最近、HHEM-2.1-Open評価システムに基づいたテスト結果が発表され、智譜AIが開発したGLM-4-9Bモデルが注目すべき成果を上げました。
評価に参加した85個の大規模言語モデルの中で、GLM-4-9Bは事実の一致率98.7%、回答率100%というトップの成績を収めました。特に注目すべきは、幻覚率がわずか1.3%だったことです。これはトップの座を獲得しただけでなく、OpenAIのGPTシリーズやGoogleのGeminiシリーズといった業界の巨人をも凌駕する成果です。
画像出典:AI生成画像、画像ライセンス提供元Midjourney
この画期的な成果は、中国の大規模言語モデルにおける「幻覚率」の低減において重要な進歩を遂げたことを示しており、AIアプリケーションの信頼性と正確性の向上に新たな可能性をもたらします。これは智譜AIのモデル開発における技術力を示すだけでなく、世界的なAI分野における新たなベンチマークも確立しました。
現在、AI技術競争が激化する中、GLM-4-9Bモデルの優れたパフォーマンスは、智譜AIへの注目を集めることは間違いなく、中国のAI企業が国際舞台でより大きな発言権を得るためにも貢献するでしょう。