No campo da inteligência artificial, uma pesquisa inovadora da China está chamando a atenção. Cientistas da Universidade Tsinghua e do Laboratório de Inteligência Artificial de Xangai propuseram uma nova estrutura chamada "Diagrama de Pensamento" (Diagram of Thought, ou DoT), uma descoberta inovadora que promete revolucionar nossa compreensão dos modelos de pensamento de IA.
A ideia central da estrutura DoT é imitar o processo de pensamento humano na resolução de problemas complexos. Assim como nós, ao resolver problemas difíceis, formulamos hipóteses, as criticamos, as revisamos e, finalmente, chegamos a uma conclusão, o DoT permite que a IA construa um grafo acíclico direcionado (DAG) dentro de um único modelo, alcançando um raciocínio mais próximo do humano.
O caráter único desse novo modelo de pensamento reside em sua capacidade de superar as limitações do raciocínio de IA tradicional. Diferentemente dos métodos de raciocínio lineares ou em árvore, o DoT organiza proposições, críticas, revisões e verificações em uma estrutura DAG coerente. Essa estrutura permite que a IA explore caminhos de raciocínio mais complexos, mantendo a consistência lógica. Cada nó representa uma proposição proposta, criticada, revisada ou verificada, permitindo que a IA refine seu processo de raciocínio por meio de feedback em linguagem natural.
A implementação da estrutura DoT depende de um design inteligente: o uso da previsão autorregressiva da próxima palavra com marcadores de função específica permite uma transição perfeita entre a geração de ideias e a avaliação crítica. Esse método oferece um mecanismo de feedback mais rico do que os simples sinais binários. Durante o processo de raciocínio, a IA assume diferentes funções em diferentes estágios — um "proponente" formula proposições, um "crítico" as critica e um "resumidor" integra as proposições verificadas em uma cadeia de raciocínio coerente. Essas funções são claramente diferenciadas na saída do modelo por meio de marcadores especiais.
Do ponto de vista matemático, a estrutura DoT é baseada na teoria da topologia. Essa teoria fornece uma estrutura unificada para matemática e lógica; usando a estrutura topológica e as categorias PreNet, os pesquisadores podem representar precisamente o processo de raciocínio no DoT, garantindo sua consistência lógica e eficácia.
Na prática, o processo de treinamento da estrutura DoT envolve a formatação de dados de exemplo em uma estrutura específica, incluindo marcadores de função e representação DAG. Na fase de raciocínio, o modelo gera proposições, críticas e resumos prevendo a próxima palavra, sendo todo o processo guiado por marcadores específicos de função, garantindo a coerência e precisão do raciocínio.
O significado desta pesquisa não se limita ao meio acadêmico. Com a ampla aplicação da tecnologia de IA em vários setores, a estrutura DoT promete revolucionar a resolução de problemas complexos, sistemas de suporte à decisão, processamento de linguagem natural e outros campos. Pode fazer com que a IA se destaque no processamento de tarefas que exigem pensamento profundo e análise multifacetada, como pesquisa científica, formulação de estratégias e redação criativa.
No entanto, devemos reconhecer que, embora a estrutura DoT tenha feito grandes avanços na simulação do pensamento humano, ainda existem diferenças essenciais entre a IA e o pensamento humano. Como melhorar a integração da criatividade e intuição humanas, mantendo a eficiência da IA, ainda é uma área de pesquisa futura.
Endereço do artigo: https://arxiv.org/pdf/2409.10038