Le 25 septembre, OpenAI a lancé plusieurs fonctionnalités multimodales pour ChatGPT, son populaire chatbot conversationnel, notamment l'interaction vocale et la reconnaissance d'images. Ces nouvelles fonctionnalités permettent aux utilisateurs d'interagir via la voix et le téléchargement d'images, offrant ainsi des capacités de reconnaissance vocale, de reconnaissance de texte et de détection d'objets. Cette version multimodale de ChatGPT, nommée GPT-4V, a été entraînée en même temps que GPT-4, mais sa sortie a été retardée par souci de sécurité. OpenAI a indiqué que ces nouvelles fonctionnalités seraient d'abord déployées pour les abonnés ChatGPT Plus et les utilisateurs de la version Entreprise.