OpenAI lança CriticGPT: novo modelo para melhorar a qualidade do código de IA

AIbase

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Jun 28, 2024

117

Pesquisadores da OpenAI anunciaram na quinta-feira o lançamento do CriticGPT, um modelo de IA inovador projetado para identificar e corrigir erros no código gerado pelo ChatGPT. Este avanço significativo representa um passo importante para a automelhora e o controle de qualidade na tecnologia de inteligência artificial.

QQ截图20240628091656.png

Principais características do CriticGPT

1. Baseado na série GPT-4: O CriticGPT é construído sobre a poderosa base do modelo de linguagem GPT-4.

2. Foco na revisão de código: Principalmente usado para analisar o código de programação gerado pelo ChatGPT e apontar potenciais erros.

3. Colaboração homem-máquina: Como assistente de IA para treinadores humanos, aumenta a eficiência e precisão da revisão de código.

4. Aprendizado por reforço: Através do aprendizado com feedback humano (RLHF), melhora o nível de "alinhamento" do sistema de IA.

QQ截图20240628091930.png

Processo de desenvolvimento e resultados

Os pesquisadores adotaram métodos de treinamento inovadores para desenvolver o CriticGPT:

1. Preparação do conjunto de dados: Treinamento usando amostras de código com erros intencionalmente inseridos.

2. Participação humana: Treinadores humanos foram solicitados a modificar o código escrito pelo ChatGPT, introduzindo erros e fornecendo feedback.

3. Aplicação de novas tecnologias: Introdução da técnica de "busca em feixe de amostragem forçada" (FSBS), para equilibrar comentários detalhados e a geração de problemas fictícios.

QQ截图20240628091944.png

Resultados experimentais mostram:

- Em 63% dos casos de erros naturais, os humanos preferiram as críticas do CriticGPT.

- O CriticGPT reduziu as críticas inúteis e os problemas de falsos positivos/alucinações.

- Em 24% dos casos previamente considerados perfeitos, o CriticGPT identificou e confirmou com sucesso erros.

Aplicações potenciais e limitações

Embora o CriticGPT seja principalmente voltado para a revisão de código, pesquisas indicam seu potencial para tarefas não relacionadas a código. No entanto, o modelo também apresenta algumas limitações:

1. Treinado principalmente em respostas mais curtas do ChatGPT, podendo não ser adequado para tarefas mais complexas.

2. Embora tenha reduzido comportamentos fictícios, não os eliminou completamente.

3. Ainda há espaço para melhorias na identificação de erros distribuídos em várias partes.

Perspectivas futuras

A OpenAI planeja integrar modelos semelhantes ao CriticGPT em seu pipeline de rotulagem RLHF, fornecendo assistência de IA para treinadores. Isso representa um avanço significativo no desenvolvimento de ferramentas para avaliar a saída de modelos de linguagem grandes (LLMs). No entanto, os pesquisadores também enfatizam que, mesmo com assistência de IA, tarefas extremamente complexas ainda representam um desafio para avaliadores humanos.

Com o desenvolvimento contínuo da tecnologia de IA, inovações como o CriticGPT desempenharão um papel fundamental na melhoria da precisão e confiabilidade dos sistemas de IA, promovendo um maior alinhamento entre a IA e as necessidades humanas.

Endereço:https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/

Modelo o1 completo do OpenAI revelado: capacidades impressionantes, processa 200.000 tokens

Recentemente, um usuário relatou na plataforma de mídia social X que o novo modelo o1 do OpenAI foi brevemente disponibilizado para alguns usuários por meio do URL “chatgpt.com/?model=o1”, sendo posteriormente desativado. De acordo com o feedback do usuário, este modelo mais recente consegue processar aproximadamente 200.000 palavras de texto e possui a capacidade de analisar imagens. O OpenAI se refere ao modelo o1 como seu "modelo mais poderoso", especialmente adequado para tarefas que exigem criatividade e raciocínio avançado.

OpenAI Lança o GPT-4O-Audio-Preview: Áudio que 'Entende' Emoções!

A OpenAI lidera novamente a inovação em inteligência artificial com o lançamento do novo modelo gpt-4o-audio-preview. Este modelo demonstra capacidades surpreendentes na geração e análise de áudio, abrindo novas possibilidades para a interação humano-computador. Vamos explorar os recursos deste modelo inovador e suas potenciais aplicações. As principais funcionalidades do gpt-4o-audio-preview incluem três aspectos: primeiro, ele pode gerar respostas de voz naturais e fluidas com base em texto, fornecendo suporte para aplicativos como assistentes de voz e atendimento virtual.

Novo modelo OpenAI gpt-4o-2024-08-06 e gpt-4o-mini com suporte a saída estruturada

A OpenAI adicionou a funcionalidade de saída estruturada à sua API, garantindo que a saída gerada esteja totalmente em conformidade com o esquema JSON predefinido, melhorando significativamente a confiabilidade da API e a precisão dos aplicativos. Este recurso não apenas define a estrutura do JSON, mas também garante a precisão da saída. Simultaneamente, houve uma redução de preços, com o custo de entrada reduzido pela metade e o custo de saída reduzido em 1/3. A introdução da saída estruturada resolveu as limitações do esquema JSON em garantir que a saída esteja em conformidade com uma estrutura específica, melhorando significativamente o desempenho do modelo em relação à saída estruturada. Através de inovações tecnológicas, como restrições...

OpenAI lança novo modelo gpt-4o-64k-output-alpha: GPT-4o API agora suporta até 64K de saída

O principal destaque do novo modelo gpt-4o-64k-output-alpha da OpenAI é a capacidade de gerar uma saída de até 64K tokens de uma só vez, ideal para produzir conteúdo rico e detalhado, atendendo às necessidades de redação, programação e análise de dados complexos. No entanto, este recurso aumenta o preço da API, custando US$ 18 por milhão de tokens de saída, em comparação com US$ 6 por milhão de tokens de entrada. Essa medida visa equilibrar os altos custos computacionais e incentivar o uso responsável desta poderosa ferramenta. O modelo é uma ferramenta valiosa para os campos da criação e da pesquisa.