L'architecture de réseau neuronal KAN a atteint sa version 2.0. Cette mise à jour permet une intégration plus approfondie de KAN avec les problèmes scientifiques, notamment dans le domaine de la physique classique. Les chercheurs peuvent désormais personnaliser leur propre KAN 2.0, en intégrant des connaissances spécialisées dans le modèle afin de découvrir des concepts importants tels que le lagrangien dans les systèmes physiques.
KAN 2.0 permet aux chercheurs de personnaliser le modèle en fonction de leurs besoins, en utilisant des connaissances spécialisées comme variables auxiliaires, offrant ainsi un nouveau point de vue sur la recherche en physique classique.
Le nouveau framework KAN 2.0 vise à résoudre le problème d'incompatibilité inhérente entre l'IA et les sciences. Il réalise l'unification de l'IA et des sciences grâce à une interaction bidirectionnelle : l'intégration des connaissances scientifiques dans KAN et l'extraction d'informations scientifiques à partir de KAN.
Les trois nouvelles fonctionnalités principales de KAN 2.0
MultKAN : KAN avec l'introduction de nœuds multiplicatifs, améliorant la capacité d'expression du modèle.
kanpiler : un compilateur qui compile des formules symboliques en KAN, améliorant l'utilité du modèle.
Transformateur d'arbres : transforme l'architecture KAN 2.0 en un arbre, améliorant l'explicabilité du modèle.
Le rôle de KAN 2.0 dans la découverte scientifique se manifeste principalement dans trois aspects : l'identification des caractéristiques importantes, la révélation de la structure modulaire et la découverte de formules symboliques. Ces fonctionnalités ont été améliorées par rapport au KAN original.
L'explicabilité de KAN 2.0 est plus générale et s'applique à des domaines tels que la chimie et la biologie, difficiles à représenter par des équations symboliques. Les utilisateurs peuvent intégrer des structures modulaires dans KAN 2.0 et les visualiser intuitivement grâce à des échanges avec les neurones MLP.
L'équipe de recherche prévoit d'appliquer KAN 2.0 à des problèmes de plus grande envergure et de l'étendre à d'autres disciplines scientifiques au-delà de la physique.
Cette recherche a été menée conjointement par cinq chercheurs de différentes institutions, dont le MIT, le California Institute of Technology et le MIT CSAIL, parmi lesquels trois chercheurs d'origine chinoise. L'auteur principal de l'article, Liu Ziming, est un doctorant de quatrième année au MIT, dont les intérêts de recherche se concentrent sur l'intersection de l'intelligence artificielle et de la physique.
Adresse de l'article : https://arxiv.org/pdf/2408.10205
Adresse du projet : https://github.com/KindXiaoming/pykan