北京智源人工智能研究院(BAAI)は先日、エコシステムパートナーと協力して構築し、オープンソース化した異種混合統一通信ライブラリFlagCXを発表しました。これは、多元的な計算能力の時代における通信ライブラリが直面する課題を解決し、多元的な計算能力のオープンソースソフトウェアスタックにおける重要な空白を埋めることを目的としています。この取り組みは、国家関係部門が組織した「清朗・ネットワークプラットフォームアルゴリズム典型問題治理」特別行動に応じたものであり、アルゴリズムの指向が正しく、公平公正、公開透明といった重要な原則を体現しています。
多元的な計算能力の時代において、通信ライブラリは計算能力の大規模な集約の基盤となるソフトウェアであり、2つの大きな課題に直面しています。1つは、通信ライブラリがそれぞれ異なっており、通信アルゴリズムの実装と最適化が汎用性と適応性を欠いていること、もう1つは、異なるチップ間で効率的に相互接続できないことです。これらの課題に対処するために、FlagCXは異なるチップ間での効率的な通信と、さまざまなシナリオにおける大規模な適応型通信最適化を実現することを目指しています。
FlagCXのアーキテクチャ設計は「ゼロオーバーヘッド」と「ゼロコスト」の原則に従っており、上位アプリケーションに統一された通信演算子インターフェース層を提供し、下位層の異なる実装の詳細を隠蔽します。そして、これに基づいて異なる深層学習フレームワークに接続するプラグインを開発し、ユーザーが異なるフレームワークでFlagCXをゼロコストで使用できるようにします。FlagCXの設計と実装においては、標準化、互換性、適応性の3つの基本原則を常に遵守しています。
性能テストの結果、FlagCXはクロスマシン通信性能において、メーカー純正の通信ライブラリとの互換性がほぼゼロオーバーヘッドで実現され、異なるチップ間の異種混合通信性能はピーク帯域幅の90%以上を達成し、クロスチップ異種混合通信の可能性を示しています。
さらに、智源研究院は関連ソフトウェアエコシステムの構築にも取り組んでおり、産学研連携による好循環を形成し、異種混合統一通信ライブラリ技術の普及と応用展開を加速させています。最初のエコシステムパートナーには、大学や研究機関、サーバーメーカー、チップメーカー、クラウドメーカーや通信事業者などが含まれています。
FlagCXのオープンソースアドレス:https://github.com/FlagOpen/FlagCX