ニューラルネットワークアーキテクチャKANがバージョン2.0にアップデートされました。今回の更新により、KANは科学的問題、特に古典物理学研究分野との連携をさらに深めました。研究者は、KAN2.0をカスタマイズし、専門知識をモデルに統合することで、物理システムにおけるラグランジアンなどの重要な概念を発見できるようになりました。
KAN2.0では、研究者は個々のニーズに合わせてモデルをカスタマイズし、専門知識を補助変数として活用することで、古典物理学研究に新たな視点をもたらします。
新しいフレームワークKAN2.0は、AIと科学の間にある固有の非互換性の問題を解決することを目指しています。科学知識をKANに統合し、KANから科学的知見を抽出するという双方向の協調作用を通じて、AIと科学の統合を実現します。
KAN2.0の3つの新機能
MultKAN:乗算ノードを導入したKANで、モデルの表現能力が向上しました。
kanpiler:数式をKANにコンパイルするコンパイラで、モデルの実用性が向上しました。
ツリー変換器:KAN2.0アーキテクチャをツリー状の図に変換することで、モデルの解釈性が向上しました。
KAN2.0の科学発見における役割は、重要な特徴の特定、モジュール構造の解明、数式の発見の3つの側面に大きく表れています。これらの機能は、元のKANをベースに強化されています。
KAN2.0の解釈性はより汎用的になり、数式で表現するのが難しい化学や生物学などの分野にも適用可能です。ユーザーはモジュール構造をKAN2.0に組み込み、MLPニューロンとの交換を通じて、モジュール構造を直感的に確認できます。
研究チームは、KAN2.0をより大規模な問題に適用し、物理学以外の科学分野にも拡張する計画です。
この研究は、MIT、カリフォルニア工科大学、MIT CSAILなどの機関の5人の研究者(うち3人は中国人学者)によって共同で行われました。論文の筆頭著者はMITの4年生博士課程の学生である劉子鳴氏で、彼の研究興味は人工知能と物理学の交差点にあります。
論文アドレス:https://arxiv.org/pdf/2408.10205
プロジェクトアドレス:https://github.com/KindXiaoming/pykan