Conceptos absurdos de picnic en las primeras versiones de DALL-E 3 antes de los ajustes de OpenAI

DE解码器

Publicado elNoticias de IA · 3 minutos de lectura · Oct 8, 2023

La nueva IA de imágenes de OpenAI, DALL-E 3, se está implementando actualmente en ChatGPT y en el creador de imágenes de Bing. OpenAI está documentando sus esfuerzos para evitar que los usuarios generen imágenes potencialmente dañinas u ofensivas.

Los documentos muestran que la integración de DALL-E 3 en ChatGPT es una medida tanto de seguridad como de conveniencia. Esto se debe a que ChatGPT puede utilizar la llamada "conversión de indicaciones" para comprobar si las indicaciones del usuario podrían infringir las normas de contenido y, a continuación, reescribirlas para evitar la infracción si la infracción parece no ser intencionada.

Para establecer límites y realizar pruebas, OpenAI también recurre a ejercicios de "red teaming", en los que personas designadas intentan, mediante indicaciones específicas, que DALL-E 3 genere imágenes inapropiadas. Para el contenido sexista u otro contenido "inquietante", OpenAI entrenó un clasificador de salida de imágenes para detectar patrones sospechosos en las imágenes y detener su generación.

La versión publicada de DALL-E 3 ha reducido el riesgo de este tipo de imágenes no deseadas a un 0,7%.

En cuanto a los derechos de autor, OpenAI reconoce que, a pesar de todas las medidas de mitigación de riesgos, algunos objetos comunes pueden estar fuertemente asociados con contenido de marca o marca registrada y, por lo tanto, pueden generarse como parte de la representación de escenas realistas, debido a la imposibilidad de predecir cada combinación posible.

智谱发布首个支持生成汉字的开源文生图模型CogView4

Beijing Zhihuazhang Technology Co., Ltd. ha anunciado el lanzamiento de CogView4, el primer modelo de generación de imágenes a partir de texto de código abierto que admite la generación de caracteres chinos. Este modelo ocupa el primer lugar en la clasificación general de las pruebas de referencia DPG-Bench, convirtiéndose en el mejor modelo de generación de imágenes a partir de texto de código abierto (SOTA), y sigue el protocolo Apache2.0, siendo el primer modelo de generación de imágenes que admite este protocolo.

Ideogram 2a: Modelo de imagen lanzado oficialmente; generación de imágenes con IA más rápida y económica

Ideogram, una empresa canadiense de generación de imágenes con IA, anunció hoy el lanzamiento oficial de su nuevo modelo de imágenes, Ideogram 2a, disponible en el sitio web de Ideogram, la API y las plataformas de socios. Este lanzamiento ha generado un gran revuelo en la plataforma X, y se considera una mejora importante en el campo de la generación de imágenes a partir de texto con IA. Ideogram 2a atrae la atención de creadores y desarrolladores de todo el mundo gracias a su mayor velocidad de generación, menor costo y capacidades optimizadas de diseño gráfico y fotografía.

Noticias de IA

Conceptos absurdos de picnic en las primeras versiones de DALL-E 3 antes de los ajustes de OpenAI

DE解码器

Noticias de IA relacionadas recomendadas

Flujo de silicio: modelos no registrados fuera de línea. Los usuarios deben tener en cuenta la migración

智谱发布首个支持生成汉字的开源文生图模型CogView4

¡Impresionante! MiniMax lanza el nuevo modelo de generación de imágenes Image-01 con un costo 10 veces menor

Ideogram 2a: Modelo de imagen lanzado oficialmente; generación de imágenes con IA más rápida y económica