GPT-4とDALL-E 3は画像内の物が「牛」か「サメ」かを判断できない

夕小瑶科技说

公開日AIニュース · 1 分で読めます · Oct 18, 2023

本稿では、GPT-4とDALL-E 3を用いた画像テキスト生成の対抗実験を通して、両者が曖昧な画像を処理する際の限界を検証しました。著者はぼやけた「牛ザメ」の画像を入力し、GPT-4に記述させた後、DALL-E 3に描画させました。描画された画像を再びGPT-4に入力して記述させる、というサイクルを繰り返しました。その結果、GPT-4はぼやけた画像が牛なのかサメなのかを判断できず、DALL-E 3が描いた画像にも矛盾が見られました。この実験は、反復テストを用いて大規模言語モデルの画像テキスト理解と生成能力の限界を深く検証する方法を探っています。

GPT-4 DALL-E 3 画像生成

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

バイトダンスSeedream 3.0テキストから画像生成モデル技術レポート発表：複数性能の大幅アップグレード

バイトダンスSeedチームは、Seedream 3.0テキストから画像生成モデルの技術レポートを発表しました。このモデルは性能において大幅な向上を実現し、ネイティブの高解像度をサポートし、中国語と英語の両言語に対応した画像生成基礎モデルです。解像度、画像構造の正確性など多くの点でブレークスルーを達成し、以前のバージョンと比較して顕著な優位性を示しています。Seedream 3.0の様々な側面でのパフォーマンス。図中の各次元のデータは、最適な指標を基準として正規化されています。機能のハイライトとしては、Seedream 3.0はネイティブで…

Apr 16, 2025

ChatGPTが画像ライブラリ機能を追加！AIによる画像生成と管理がさらに簡単に！

Apr 16, 2025

OpenAI、Xのようなソーシャルメディア機能を導入か ChatGPTとの統合も計画

AI分野をリードするOpenAIが、事業拡大を計画している。複数のメディアの最新報道によると、OpenAIはX（旧Twitter）に似たソーシャルメディア機能を開発中で、人気のAIチャットツールChatGPTへの統合も検討しているという。プロジェクトはまだ初期段階にあり、画像生成とソーシャルインタラクションに焦点を当てている。The Vergeの報道によると、OpenAIは既にこのソーシャルメディア機能の内部プロトタイプを開発しており、ChatGPTを中心に機能が設計されている。

Apr 16, 2025

新感覚SNSツール！Ghiblio.artでジブリ風画像に変換

Ghiblio.artは、写真をジブリ風の芸術作品に変換することに特化したオンラインAIツールです。スタジオジブリは、『千と千尋の神隠し』や『となりのトトロ』などの名作で知られる、手描き風の柔らかい色調と幻想的な雰囲気のシーンが特徴的なスタジオです。Ghiblio.artは高度なAIアルゴリズムを使用して、ユーザーがアップロードした写真を自動的にジブリ風のイラストに変換し、通常の画像に夢のようなアニメーションの質感を与えます。AIbaseの情報によると、ユーザーは写真をアップロードして、オプションを選択するだけで…

Apr 16, 2025

ChatGPT大幅アップデート：画像ライブラリ機能追加、GPTで生成した画像を全て確認可能に

OpenAIは、ChatGPTの大幅なアップデートを発表しました。新しい画像ライブラリ機能が正式にリリースされ、ユーザーは統一されたインターフェースで、GPT-4モデルで生成したすべての画像の閲覧、編集、共有が可能になります。この機能は、無料、Plus、Proユーザーに段階的に展開され、AI画像生成におけるユーザーの創作体験を大幅に向上させます。画像ライブラリ機能：AI創作を一元管理ChatGPTの画像ライブラリ機能は、ユーザーがGPT-4で生成したすべての画像を保存および管理するための集中プラットフォームを提供します。

Apr 16, 2025

無料で楽しめる！Veo2がGoogle AI Studioに登場、8秒間の超リアルな動画生成が可能に

Apr 16, 2025

OpenAIがGPT-4.1プロンプトエンジニアリングガイドを発表、開発者がモデルを正確に制御

人工知能技術の急速な発展により、プロンプトエンジニアリング（Prompt Engineering）への要求が高まっています。AIbaseはソーシャルメディアから、OpenAIが最近GPT-4.1向けのプロンプトエンジニアリングガイドを発表したことを知りました。このガイドでは、明確で正確なプロンプトを通じてモデルのパフォーマンスを最大化する方法を詳細に説明しています。このガイドは従来のベストプラクティスを引き継ぎつつ、GPT-4.1の独自の特性に合わせた最適化提案も提供しています。以下は、AIbaseによるこのガイドの深層分析です。その核心内容をご覧ください。

Apr 15, 2025

100

AIデイリーニュース：智譜が32B/9BシリーズGLMモデルをオープンソース化しZ.aiドメインを有効化、OpenAIがGPT-4.1シリーズモデルを発表、阿里巴巴魔搭がMCP広場をローンチ

Apr 15, 2025

原子力レベルの進化！可霊AIが2.0時代へ突入多様なモード編集と画像編集機能を追加

Apr 15, 2025

国内初のオープンソースAI画像生成モデルHiDream-I1リリース GPT-4oに匹敵する能力

Apr 15, 2025

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

GPT-4とDALL-E 3は画像内の物が「牛」か「サメ」かを判断できない

夕小瑶科技说

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

バイトダンスSeedream 3.0テキストから画像生成モデル技術レポート発表：複数性能の大幅アップグレード

ChatGPTが画像ライブラリ機能を追加！AIによる画像生成と管理がさらに簡単に！

OpenAI、Xのようなソーシャルメディア機能を導入か ChatGPTとの統合も計画

新感覚SNSツール！Ghiblio.artでジブリ風画像に変換

ChatGPT大幅アップデート：画像ライブラリ機能追加、GPTで生成した画像を全て確認可能に

無料で楽しめる！Veo2がGoogle AI Studioに登場、8秒間の超リアルな動画生成が可能に

OpenAIがGPT-4.1プロンプトエンジニアリングガイドを発表、開発者がモデルを正確に制御

AIデイリーニュース：智譜が32B/9BシリーズGLMモデルをオープンソース化しZ.aiドメインを有効化、OpenAIがGPT-4.1シリーズモデルを発表、阿里巴巴魔搭がMCP広場をローンチ

原子力レベルの進化！可霊AIが2.0時代へ突入 多様なモード編集と画像編集機能を追加

国内初のオープンソースAI画像生成モデルHiDream-I1リリース GPT-4oに匹敵する能力

原子力レベルの進化！可霊AIが2.0時代へ突入多様なモード編集と画像編集機能を追加