O novo modelo de IA de imagens DALL-E 3 da OpenAI está sendo atualmente integrado ao ChatGPT e ao gerador de imagens do Bing. A OpenAI está documentando seus esforços para prevenir a geração de imagens potencialmente prejudiciais ou ofensivas pelos usuários.
Documentos mostram que a integração do DALL-E 3 ao ChatGPT serve como uma medida de segurança e conveniência. Isso porque o ChatGPT pode usar a chamada "conversão de prompts" para verificar se as solicitações do usuário podem violar as políticas de conteúdo e, em seguida, reescrevê-las para contornar violações, caso o desvio pareça não intencional.
Para definir limites e testar o sistema, a OpenAI também utiliza exercícios de "red teaming", onde indivíduos designados tentam fazer o DALL-E 3 gerar imagens problemáticas através de prompts específicos. Para conteúdo sexista ou outras imagens "perturbadoras", a OpenAI treinou um classificador de saída de imagem para detectar padrões suspeitos e interromper a geração.
A versão lançada do DALL-E 3 reduziu o risco de geração de imagens indesejadas para 0,7%.
Em relação a questões de direitos autorais, a OpenAI reconhece que, apesar de todas as medidas de mitigação de riscos, alguns itens comuns podem estar fortemente relacionados a marcas ou conteúdo de marcas registradas e, portanto, podem ser gerados como parte da renderização de cenários realistas, devido à impossibilidade de prever todas as combinações possíveis.