Am 25. September veröffentlichte OpenAI für seinen beliebten Chatbot ChatGPT neue Funktionen für die Mehrmodalität, darunter Sprachinteraktion und Bilderkennung. Die neuen Funktionen ermöglichen es Nutzern, über Sprachbefehle und hochgeladene Bilder zu interagieren und bieten Funktionen wie Spracherkennung, Texterkennung und Objekterkennung. Die multimodalfähige Version von ChatGPT wird GPT-4V genannt und wurde gleichzeitig mit GPT-4 trainiert. Aus Sicherheitsgründen wurde die Veröffentlichung jedoch verschoben. OpenAI gab an, dass die neuen Funktionen zunächst für ChatGPT Plus-Abonnenten und Unternehmenskunden verfügbar sein werden.