GPT-4 y DALL-E 3 no pueden determinar si el objeto en la imagen es una "vaca" o un "tiburón"

夕小瑶科技说

Publicado elNoticias de IA · 2 minutos de lectura · Oct 18, 2023

Este artículo presenta un experimento de generación de imágenes y texto adversario utilizando GPT-4 y DALL-E 3 para probar las limitaciones de ambos modelos en el manejo de imágenes borrosas. El autor ingresó una imagen borrosa de un "toro-tiburón", pidiendo a GPT-4 que la describiera. La descripción se le proporcionó a DALL-E 3 para que la dibujara, y la imagen resultante se volvió a introducir en GPT-4 para su descripción, repitiendo este ciclo. Los resultados mostraron que GPT-4 no pudo determinar si la imagen borrosa era un toro o un tiburón, y las imágenes generadas por DALL-E 3 mostraron contradicciones internas. Este experimento explora el uso de pruebas cíclicas para examinar a fondo las limitaciones de la comprensión y generación de imágenes y texto en modelos de lenguaje grandes.

GPT-4 DALL-E 3 Generación de imágenes

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

ImageSlider 2.0 se integrará en la línea de productos principal: función de generación de imágenes totalmente mejorada

Apr 25, 2025

Firefly, la herramienta de generación de imágenes con IA de Adobe, llegará a iOS y Android

En las últimas noticias, Adobe ha anunciado el lanzamiento de la versión móvil de su herramienta de generación de imágenes con IA, Firefly, con el objetivo de competir más directamente con OpenAI. Este anuncio se hizo oficial en la conferencia MAX Creative en Londres. Adobe declaró que la aplicación móvil de Firefly estará disponible pronto para iOS y Android, aunque aún no se ha especificado una fecha de lanzamiento concreta. Alexandru Co, vicepresidente de Adobe Firefly...

Apr 25, 2025

Boletín diario de IA: OpenAI lanza la API de generación de imágenes gpt-image-1; Nano AI publica el kit de herramientas universal MCP; China ocupa el 60% de las patentes mundiales de IA

Apr 24, 2025

OpenAI lanza la API gpt-image-1: capacidad de generación de imágenes 4o oficialmente abierta

OpenAI lanza oficialmente la API gpt-image-1, marcando la apertura de su muy esperada capacidad de generación de imágenes 4o a los desarrolladores. Según AIbase, esta API, con su generación de imágenes de alta fidelidad, estilos visuales diversos y poderosa capacidad de integración del conocimiento del mundo, ha sido elogiada por la comunidad como la "herramienta de generación de imágenes" más potente del mundo. El anuncio de su lanzamiento ha generado una gran expectación entre los desarrolladores de IA y la comunidad creativa, y la documentación ya está disponible a través del sitio web de OpenAI y la plataforma Playground. Funciones principales: Alta fidelidad y estilos diversos

Apr 24, 2025

OpenAI lanza la API de su nueva función de generación de imágenes de ChatGPT: los desarrolladores pueden integrar fácilmente la función de dibujo de IA

OpenAI anunció recientemente que ha puesto a disposición de los desarrolladores su última función de generación de imágenes a través de una API, lo que les permite integrar esta tecnología avanzada en diversas aplicaciones y servicios. Esta noticia sin duda ofrece a los desarrolladores una nueva oportunidad, especialmente en el campo del procesamiento y la creación de imágenes. El nuevo modelo de generación de imágenes se llama "gpt-image-1" y está respaldado por la tecnología de generación de imágenes de ChatGPT. Desde su lanzamiento a finales de marzo de este año, los usuarios pueden crear imágenes realistas al estilo del Studio Ghibli y otras.

Apr 24, 2025

Samsung Research presenta un nuevo Transformer autorregresivo para la generación de imágenes de alta resolución

Apr 22, 2025

OpenAI: Generación de imágenes con el modelo 4o ahora admite GPT personalizados para una creación de IA más personalizada

Recientemente, OpenAI anunció que su función de generación de imágenes con el nuevo modelo 4o admitirá GPT personalizados, ofreciendo a los usuarios una experiencia de creación de IA más flexible y personalizada. Según AIbase, esta actualización permite a los desarrolladores y usuarios construir GPT personalizados basados en el modelo 4o para generar contenido de imágenes de alta calidad que se ajuste a necesidades específicas. La noticia ha generado un amplio debate en la comunidad de IA y representa un avance importante de OpenAI en el campo de las herramientas de IA personalizadas. Los detalles técnicos relacionados se han publicado en la plataforma oficial de OpenAI.

Apr 21, 2025

El modelo de pensamiento profundo Doubao y el modelo de generación de imágenes por texto 3.0 abren oficialmente su API para clientes empresariales

Doubao ha lanzado recientemente una serie de actualizaciones de su gran modelo, entre las que destacan el modelo de pensamiento profundo Doubao 1.5 y el modelo de generación de imágenes por texto Doubao 3.0, que se han abierto oficialmente a través de la API de Volcano Engine para desarrolladores y clientes empresariales. Estos dos modelos han alcanzado un nivel de vanguardia en la industria en cuanto al rendimiento general en tareas de razonamiento y tareas generales, y han logrado un progreso significativo en el razonamiento visual y la generación de imágenes.

Apr 17, 2025

Lanzamiento del informe técnico del modelo de generación de imágenes a partir de texto Seedream 3.0 de ByteDance: importantes mejoras de rendimiento en múltiples áreas

El equipo Seed de ByteDance ha publicado oficialmente el informe técnico del modelo de generación de imágenes a partir de texto Seedream 3.0. Este modelo ha logrado mejoras significativas en el rendimiento, siendo un modelo básico de generación de imágenes de alta resolución nativa que admite inglés y chino, con avances en resolución, precisión de la estructura de la imagen generada y otros aspectos, mostrando ventajas notables en comparación con la versión anterior. El rendimiento de Seedream 3.0 en diferentes dimensiones. Los datos de cada dimensión en este gráfico se han ajustado mediante normalización, tomando el mejor indicador como referencia. Entre sus características más destacadas, Seedream 3.0 puede generar imágenes de forma nativa...

Apr 16, 2025

HiDream-I1: Lanzamiento del primer modelo de generación de imágenes IA de código abierto en China, con una potencia comparable a GPT-4o

China presenta HiDream-I1, su primer modelo de generación de imágenes de inteligencia artificial de código abierto. Este modelo demuestra una capacidad comparable al potente GPT-4o.

Apr 15, 2025

120

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

GPT-4 y DALL-E 3 no pueden determinar si el objeto en la imagen es una "vaca" o un "tiburón"

夕小瑶科技说

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

ImageSlider 2.0 se integrará en la línea de productos principal: función de generación de imágenes totalmente mejorada

Firefly, la herramienta de generación de imágenes con IA de Adobe, llegará a iOS y Android

Boletín diario de IA: OpenAI lanza la API de generación de imágenes gpt-image-1; Nano AI publica el kit de herramientas universal MCP; China ocupa el 60% de las patentes mundiales de IA

OpenAI lanza la API gpt-image-1: capacidad de generación de imágenes 4o oficialmente abierta

OpenAI lanza la API de su nueva función de generación de imágenes de ChatGPT: los desarrolladores pueden integrar fácilmente la función de dibujo de IA

Samsung Research presenta un nuevo Transformer autorregresivo para la generación de imágenes de alta resolución

OpenAI: Generación de imágenes con el modelo 4o ahora admite GPT personalizados para una creación de IA más personalizada

El modelo de pensamiento profundo Doubao y el modelo de generación de imágenes por texto 3.0 abren oficialmente su API para clientes empresariales

Lanzamiento del informe técnico del modelo de generación de imágenes a partir de texto Seedream 3.0 de ByteDance: importantes mejoras de rendimiento en múltiples áreas

HiDream-I1: Lanzamiento del primer modelo de generación de imágenes IA de código abierto en China, con una potencia comparable a GPT-4o