La arquitectura de red neuronal KAN ha llegado a su versión 2.0, una actualización que profundiza la integración de KAN con problemas científicos, especialmente en el campo de la física clásica. Los investigadores ahora pueden personalizar su propio KAN 2.0, integrando conocimientos especializados en el modelo para descubrir conceptos importantes en sistemas físicos, como el lagrangiano.
KAN 2.0 permite a los investigadores personalizar el modelo según sus necesidades individuales, incorporando conocimientos especializados como variables auxiliares y ofreciendo una nueva perspectiva para la investigación en física clásica.
El nuevo marco KAN 2.0 se centra en resolver la incompatibilidad inherente entre la IA y la ciencia. Logra la unificación de la IA y la ciencia mediante una interacción bidireccional: integrando conocimientos científicos en KAN y extrayendo conocimientos científicos de KAN.
Tres nuevas funciones de KAN 2.0
MultKAN: KAN con nodos multiplicativos, lo que mejora la capacidad expresiva del modelo.
kanpiler: Un compilador que traduce fórmulas simbólicas a KAN, mejorando la utilidad del modelo.
Transformador de árboles: Convierte la arquitectura KAN 2.0 en un diagrama de árbol, mejorando la interpretabilidad del modelo.
El papel de KAN 2.0 en el descubrimiento científico se manifiesta principalmente en tres aspectos: identificación de características importantes, revelación de estructuras modulares y descubrimiento de fórmulas simbólicas. Estas funciones se han mejorado con respecto al KAN original.
La interpretabilidad de KAN 2.0 es más general y se aplica a campos como la química y la biología, difíciles de representar mediante ecuaciones simbólicas. Los usuarios pueden incorporar estructuras modulares en KAN 2.0 y verlas intuitivamente mediante el intercambio con neuronas MLP.
El equipo de investigación planea aplicar KAN 2.0 a problemas a mayor escala y extenderlo a otras disciplinas científicas además de la física.
Esta investigación ha sido realizada conjuntamente por cinco investigadores de instituciones como el MIT, el Instituto de Tecnología de California y el MIT CSAIL, incluyendo tres académicos chinos. El primer autor del artículo, Liu Ziming, es un estudiante de doctorado de cuarto año en el MIT, cuyo interés de investigación se centra en la intersección de la inteligencia artificial y la física.
Enlace al artículo: https://arxiv.org/pdf/2408.10205
Enlace al proyecto: https://github.com/KindXiaoming/pykan