Das neuronale Netzwerk-Framework KAN feiert sein 2.0-Update. Diese Version vertieft die Integration von KAN mit wissenschaftlichen Fragestellungen, insbesondere im Bereich der klassischen Physik. Forscher können nun ihre eigenen KAN 2.0-Modelle anpassen und ihr Fachwissen in das Modell integrieren, um wichtige Konzepte wie die Lagrange-Funktion in physikalischen Systemen zu entdecken.
KAN 2.0 ermöglicht es Forschern, Modelle nach individuellen Bedürfnissen anzupassen und Fachwissen als Hilfsvariable einzubinden, wodurch neue Perspektiven für die Forschung in der klassischen Physik eröffnet werden.
Das neue Framework KAN 2.0 zielt darauf ab, die inhärente Inkompatibilität zwischen KI und Wissenschaft zu lösen. Dies geschieht durch eine bidirektionale Zusammenarbeit: wissenschaftliches Wissen wird in KAN integriert, und gleichzeitig werden wissenschaftliche Erkenntnisse aus KAN gewonnen – eine Vereinigung von KI und Wissenschaft.
Drei Hauptfunktionen von KAN 2.0
MultKAN: Eine Erweiterung von KAN um Multiplikationsknoten, die die Ausdrucksfähigkeit des Modells verbessert.
kanpiler: Ein Compiler, der symbolische Formeln in KAN übersetzt und die Praktikabilität des Modells erhöht.
Baum-Transformator: Wandelt die KAN 2.0-Architektur in eine Baumstruktur um, wodurch die Interpretierbarkeit des Modells verbessert wird.
Die Rolle von KAN 2.0 bei wissenschaftlichen Entdeckungen zeigt sich hauptsächlich in drei Bereichen: Identifizierung wichtiger Merkmale, Aufdeckung modularer Strukturen und Entdeckung symbolischer Formeln. Diese Funktionen wurden im Vergleich zum ursprünglichen KAN verbessert.
KAN 2.0 bietet eine allgemeinere Interpretierbarkeit und eignet sich auch für Bereiche wie Chemie und Biologie, die sich nur schwer durch symbolische Gleichungen darstellen lassen. Benutzer können modulare Strukturen in KAN 2.0 einbauen und diese durch Austausch mit MLP-Neuronen visuell darstellen.
Das Forschungsteam plant, KAN 2.0 auf größere Probleme anzuwenden und auf andere wissenschaftliche Disziplinen ausserhalb der Physik auszuweiten.
An der Forschung waren fünf Wissenschaftler des MIT, des California Institute of Technology und des MIT CSAIL beteiligt, darunter drei Wissenschaftler chinesischer Herkunft. Erstautor der Veröffentlichung ist Liu Ziming, ein Doktorand im vierten Jahr am MIT, dessen Forschungsinteresse sich auf die Schnittstelle zwischen künstlicher Intelligenz und Physik konzentriert.