kan-gpt é uma implementação de Transformadores Pré-treinados Generativos (GPTs) baseada em PyTorch que utiliza Redes de Kolmogorov-Arnold (KANs) para modelagem de linguagem. O modelo demonstrou potencial em tarefas de geração de texto, especialmente no tratamento de dependências de longo alcance. Sua importância reside em fornecer uma nova arquitetura de modelo para o campo do processamento de linguagem natural, contribuindo para melhorar o desempenho dos modelos de linguagem.