OpenAI s'apprête à lancer GPT-Vision, un modèle multimodal qui concurrencera Gemini de Google. GPT-Vision permettra à GPT-4 d'interagir avec les images de manière plus approfondie, générant du texte en lien avec leur contenu. Par ailleurs, OpenAI développe également Gobi, un modèle d'IA multimodal qui pourrait bien devenir GPT-5.
OpenAI prévoit d'annoncer de nouvelles fonctionnalités pour GPT-4 lors de sa conférence développeurs le 6 novembre. La compétition entre OpenAI et Google stimulera l'innovation dans le domaine de l'IA, au bénéfice des consommateurs.