9月25日、OpenAIは人気チャットAIであるChatGPTに、音声対話や画像認識などのマルチモーダル機能を追加しました。この新機能により、ユーザーは音声対話や画像アップロードによるインタラクションが可能になり、音声認識、テキスト認識、物体検出などの機能を利用できます。マルチモーダル版ChatGPTはGPT-4Vと呼ばれ、GPT-4と同時にトレーニングが完了していましたが、安全性を考慮してリリースが延期されていました。OpenAIは、この新機能はChatGPT Plusのサブスクリプションユーザーとエンタープライズユーザー向けにまず提供されると述べています。