A arquitetura de rede neural KAN chega à sua versão 2.0, aprofundando ainda mais a integração com problemas científicos, especialmente na pesquisa de física clássica. Os pesquisadores agora podem personalizar seu próprio KAN 2.0, integrando conhecimento especializado ao modelo para descobrir conceitos importantes em sistemas físicos, como o Lagrangiano.

O KAN 2.0 permite que os pesquisadores personalizem o modelo de acordo com suas necessidades individuais, utilizando o conhecimento especializado como variáveis auxiliares, oferecendo uma nova perspectiva para a pesquisa em física clássica.

1.png

A nova estrutura KAN 2.0 visa resolver a incompatibilidade inerente entre IA e ciência. Ele realiza a unificação da IA e da ciência através de uma interação bidirecional: integrando conhecimento científico ao KAN e extraindo insights científicos do KAN.

Três Novos Recursos do KAN 2.0

MultKAN: KAN com a introdução de nós multiplicativos, aumentando a capacidade expressiva do modelo.

kanpiler: Um compilador que traduz fórmulas simbólicas para KAN, melhorando a utilidade do modelo.

Transformador de Árvore: Converte a arquitetura KAN 2.0 em um gráfico de árvore, melhorando a interpretabilidade do modelo.

O papel do KAN 2.0 na descoberta científica se manifesta principalmente em três aspectos: identificação de características importantes, revelação de estruturas modulares e descoberta de fórmulas simbólicas. Esses recursos foram aprimorados em relação ao KAN original.

A interpretabilidade do KAN 2.0 é mais geral, aplicável a campos como química e biologia, que são difíceis de representar com equações simbólicas. Os usuários podem incorporar estruturas modulares ao KAN 2.0 e visualizar intuitivamente essas estruturas através da troca com neurônios MLP.

A equipe de pesquisa planeja aplicar o KAN 2.0 a problemas em maior escala e expandi-lo para outras disciplinas científicas além da física.

Esta pesquisa foi realizada em conjunto por cinco pesquisadores de instituições como MIT, Caltech e MIT CSAIL, incluindo três estudiosos chineses. O primeiro autor do artigo, Liu Ziming, é um doutorando do quarto ano no MIT, com interesse de pesquisa na interseção entre inteligência artificial e física.

Endereço do artigo: https://arxiv.org/pdf/2408.10205

Endereço do projeto: https://github.com/KindXiaoming/pykan