Pesquisadores da OpenAI anunciaram na quinta-feira o lançamento do CriticGPT, um modelo de IA inovador projetado para identificar e corrigir erros no código gerado pelo ChatGPT. Este avanço significativo representa um passo importante para a automelhora e o controle de qualidade na tecnologia de inteligência artificial.

QQ截图20240628091656.png

Principais características do CriticGPT

1. Baseado na série GPT-4: O CriticGPT é construído sobre a poderosa base do modelo de linguagem GPT-4.

2. Foco na revisão de código: Principalmente usado para analisar o código de programação gerado pelo ChatGPT e apontar potenciais erros.

3. Colaboração homem-máquina: Como assistente de IA para treinadores humanos, aumenta a eficiência e precisão da revisão de código.

4. Aprendizado por reforço: Através do aprendizado com feedback humano (RLHF), melhora o nível de "alinhamento" do sistema de IA.

QQ截图20240628091930.png

Processo de desenvolvimento e resultados

Os pesquisadores adotaram métodos de treinamento inovadores para desenvolver o CriticGPT:

1. Preparação do conjunto de dados: Treinamento usando amostras de código com erros intencionalmente inseridos.

2. Participação humana: Treinadores humanos foram solicitados a modificar o código escrito pelo ChatGPT, introduzindo erros e fornecendo feedback.

3. Aplicação de novas tecnologias: Introdução da técnica de "busca em feixe de amostragem forçada" (FSBS), para equilibrar comentários detalhados e a geração de problemas fictícios.

QQ截图20240628091944.png

Resultados experimentais mostram:

- Em 63% dos casos de erros naturais, os humanos preferiram as críticas do CriticGPT.

- O CriticGPT reduziu as críticas inúteis e os problemas de falsos positivos/alucinações.

- Em 24% dos casos previamente considerados perfeitos, o CriticGPT identificou e confirmou com sucesso erros.

Aplicações potenciais e limitações

Embora o CriticGPT seja principalmente voltado para a revisão de código, pesquisas indicam seu potencial para tarefas não relacionadas a código. No entanto, o modelo também apresenta algumas limitações:

1. Treinado principalmente em respostas mais curtas do ChatGPT, podendo não ser adequado para tarefas mais complexas.

2. Embora tenha reduzido comportamentos fictícios, não os eliminou completamente.

3. Ainda há espaço para melhorias na identificação de erros distribuídos em várias partes.

Perspectivas futuras

A OpenAI planeja integrar modelos semelhantes ao CriticGPT em seu pipeline de rotulagem RLHF, fornecendo assistência de IA para treinadores. Isso representa um avanço significativo no desenvolvimento de ferramentas para avaliar a saída de modelos de linguagem grandes (LLMs). No entanto, os pesquisadores também enfatizam que, mesmo com assistência de IA, tarefas extremamente complexas ainda representam um desafio para avaliadores humanos.

Com o desenvolvimento contínuo da tecnologia de IA, inovações como o CriticGPT desempenharão um papel fundamental na melhoria da precisão e confiabilidade dos sistemas de IA, promovendo um maior alinhamento entre a IA e as necessidades humanas.

Endereço:https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/