OpenAIは、GoogleのGeminiに対抗するマルチモーダルモデル「GPT-Vision」のリリースを準備しています。GPT-Visionにより、GPT-4は画像関連の幅広い用途が可能になり、画像の内容に関連したテキストを生成できるようになります。
さらにOpenAIは、「Gobi」というマルチモーダルAIモデルの開発にも取り組んでおり、これがGPT-5となる可能性があります。
OpenAIは、11月6日に開催される開発者会議で、GPT-4の新たな機能を発表する予定です。
OpenAIとGoogleの競争は、AI技術の進歩を促進し、最終的には消費者が恩恵を受けることになるでしょう。