北京智源人工智能研究院は、最強のオープンソース中英両言語対応大規模言語モデル「悟道・天鷹 340億パラメーター (Aquila2-34B)」を発表しました。
この新しいモデルは、推論や汎化能力において優れた性能を発揮し、エージェント、コード生成、文献検索などの様々な場面で成果を上げています。
智源研究院は、Aquila2 モデルシリーズ、意味ベクトルモデルBGEの最新版、FlagScale高効率並列トレーニングフレームワーク、FlagAttention高性能Attention演算子セットなど、包括的なオープンソースツール群も公開しました。これらのオープンソースプロジェクトは、大規模言語モデル研究における協調的なイノベーションを促進するでしょう。
Aquila2-34B基盤モデルは、総合的な能力において他のオープンソース基盤モデルを凌駕しています。智源チームは、モデルの拡張能力を高めるNLPE手法も開発しました。
推論能力においては、GPT-4に次ぐ性能を誇ります。