本文通过GPT-4和DALL-E 3的图文生成对抗实验,测试了两者在处理模糊图形时的局限性。作者输入模糊的“牛鲨”图像,让GPT-4描述后交给DALL-E 3绘图,绘出的图像再输入GPT-4描述,如此循环。结果发现,GPT-4无法判断该模糊图像究竟是牛还是鲨,DALL-E 3绘制出的图像也存在自相矛盾。该实验探索了利用循环测试的方法去深入检验大模型的图文理解与生成能力的局限性。