Cet article présente une expérience d'opposition de génération d'images et de texte utilisant GPT-4 et DALL-E 3, afin de tester leurs limites dans le traitement d'images floues. L'auteur a fourni une image floue de "requin-taureau" à GPT-4 pour la description, puis a demandé à DALL-E 3 de créer une image à partir de cette description. L'image générée a ensuite été soumise à GPT-4 pour une nouvelle description, et ainsi de suite. Les résultats ont montré que GPT-4 était incapable de déterminer si l'image floue représentait un taureau ou un requin, et les images produites par DALL-E 3 présentaient des contradictions. Cette expérience explore l'utilisation de tests itératifs pour examiner en profondeur les limites de la compréhension et de la génération d'images et de texte par les grands modèles.
GPT-4 et DALL-E 3 incapables de déterminer si l'objet sur l'image est une "vache" ou un "requin"

夕小瑶科技说
53
© Tous droits réservés AIbase基地 2024, cliquez pour voir la source -https://www.aibase.com/fr/news/2245