神经网络架构KAN迎来了它的2.0版本,这次更新让KAN与科学问题的结合更加深入,特别是在经典物理学研究领域。研究者现在可以定制自己的KAN2.0,将专业知识融入模型,以发现物理系统中的拉格朗日量等重要概念。
KAN2.0允许研究者根据个人需求定制模型,将专业知识作为辅助变量,为经典物理学的研究提供新的视角。
新框架KAN2.0致力于解决AI与科学之间固有的不兼容性问题。它通过双向协同作用——将科学知识融入KAN,并从KAN中提取科学见解——来实现AI与科学的统一。
KAN2.0的三大新功能
MultKAN:引入乘法节点的KAN,增强了模型的表达能力。
kanpiler:一个将符号公式编译成KAN的编译器,提高了模型的实用性。
树转化器:将KAN2.0架构转换为树状图,增强了模型的解释性。
KAN2.0在科学发现中的作用主要体现在三个方面:识别重要特征、揭示模块结构、发现符号公式。这些功能在原始KAN基础上得到了增强。
KAN2.0的解释性更加通用,适用于化学、生物学等难以用符号方程表示的领域。用户可以将模块化结构构建到KAN2.0中,并通过与MLP神经元交换,直观地看到模块化结构。
研究团队计划将KAN2.0应用于更大规模的问题,并将其扩展到物理学以外的其他科学学科。
此次研究由来自MIT、加州理工学院、MIT CSAIL等机构的五位研究者共同完成,其中包括三位华人学者。论文一作刘子鸣是MIT的四年级博士生,他的研究兴趣集中在人工智能与物理学的交叉领域。
论文地址:https://arxiv.org/pdf/2408.10205
项目地址:https://github.com/KindXiaoming/pykan