Usando sua própria espada contra seu próprio escudo? OpenAI lança o modelo CriticGPT para 'caçar erros' no ChatGPT

Na área da inteligência artificial, a geração e revisão de código sempre foram um campo de batalha importante para o progresso tecnológico. A OpenAI lançou recentemente um modelo baseado em GPT-4 — o CriticGPT — especialmente projetado para revisar o código gerado pelo ChatGPT e identificar erros. A adição desta ferramenta inovadora marca um passo importante para a inteligência artificial em termos de auto-supervisão e detecção de erros.

Embora grandes modelos de linguagem (LLMs) como o ChatGPT tenham alcançado feitos notáveis na geração de código, ainda existe incerteza quanto à qualidade e correção da saída. O CriticGPT surgiu para compensar essa deficiência. Ele gera comentários em linguagem natural para auxiliar especialistas humanos a avaliar o código com mais precisão, melhorando significativamente a capacidade e a eficiência na detecção de erros.

Desempenho excepcional na detecção de erros

O CriticGPT se destaca na identificação de erros no código, sejam erros de sintaxe, erros lógicos ou vulnerabilidades de segurança; ele consegue identificá-los e apontá-los um a um. Estudos mostram que o CriticGPT detectou um número de erros até maior do que os avaliadores humanos, uma descoberta revolucionária no campo da revisão de código.

Redução de vieses e aumento da eficiência da colaboração

O CriticGPT também contribui significativamente para reduzir erros de alucinação. Em colaboração com especialistas humanos, o CriticGPT consegue reduzir significativamente os vieses na detecção de erros, mantendo ao mesmo tempo uma capacidade eficiente de identificação de erros. Esse modelo de trabalho em "equipe humano-máquina" oferece uma nova perspectiva para a detecção de erros.

Principais funções do CriticGPT

Detecção de erros: O CriticGPT analisa o código completamente, identifica e relata vários tipos de erros, evitando ao mesmo tempo erros de alucinação.

Geração de comentários críticos: Fornece análises detalhadas de erros e sugestões de melhorias, ajudando a equipe a entender e resolver problemas profundamente.

Melhora da eficácia do treinamento: Trabalha com treinadores humanos para melhorar a qualidade e a abrangência dos comentários.

Redução de falsos erros: Emprega uma estratégia de busca em feixe de amostragem forçada para reduzir marcações de erros desnecessárias.

Treinamento e otimização do modelo: Através do treinamento RLHF, o desempenho do CriticGPT é continuamente otimizado.

Busca e avaliação precisas: Equilibra a localização de problemas e falsos positivos, fornecendo relatórios de erros precisos.

Aprimoramento da colaboração entre humanos e IA: Como ferramenta auxiliar, aumenta a eficiência e a precisão da avaliação.

Métodos técnicos e resultados experimentais

O CriticGPT é treinado por meio de aprendizado por reforço a partir de feedback humano, focando no processamento de entradas contendo erros. Os pesquisadores treinaram o CriticGPT inserindo erros artificialmente no código e fornecendo feedback. Os resultados experimentais mostram que o CriticGPT é mais apreciado pelos treinadores ao fornecer críticas, com uma qualidade de crítica mais alta e mais útil para descobrir e resolver problemas.

A introdução dessa tecnologia não apenas melhora a precisão da revisão de código, mas também oferece novas possibilidades para a auto-supervisão e o aprendizado contínuo da inteligência artificial. Com a contínua otimização e aplicação do CriticGPT, temos razões para acreditar que ele desempenhará um papel importante na melhoria da qualidade do código e no avanço tecnológico.

Artigo: https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf

Notícias e Informações de IA

Usando sua própria espada contra seu próprio escudo? OpenAI lança o modelo CriticGPT para 'caçar erros' no ChatGPT

AIbase