OpenAI bereitet die Einführung von GPT-Vision vor, einem multimodalen Modell, das mit Googles Gemini konkurrieren soll. GPT-Vision erweitert die Fähigkeiten von GPT-4 im Umgang mit Bildern und ermöglicht die Generierung von Texten, die sich auf den Bildinhalt beziehen.
Darüber hinaus entwickelt OpenAI ein multimodales KI-Modell namens Gobi, das möglicherweise als GPT-5 Nachfolger fungieren wird.
Auf der Entwicklerkonferenz am 6. November plant OpenAI, neue Funktionen von GPT-4 vorzustellen.
Der Wettbewerb zwischen OpenAI und Google wird den Fortschritt der KI-Technologie vorantreiben, wovon letztendlich die Verbraucher profitieren.