Der jüngste Wettstreit zwischen Google und OpenAI hat sich erneut zugespitzt. Nur einen Tag nachdem das neue GPT-4o die Spitze der KI-Rangliste erobert hatte, brachte Google sein neuestes experimentelles Modell Gemini-Exp-1121 heraus und holte sich umgehend den Spitzenplatz zurück. Dies geschah nur eine Woche nach der Veröffentlichung von Gemini-Exp-1114, was auf eine äußerst schnelle Reaktion von Google auf die Entwicklungen bei OpenAI hindeutet.

image.png

Jack Rae, Chefforscher bei Google DeepMind, bezeichnete dies als einen „Blitzkrieg“ und deutete an, dass die Iterationsgeschwindigkeit bei der Nachschulung schneller ist als bei der Vorab-Schulung.

Laut offiziellen Angaben wurde Gemini-Exp-1121 in mehreren Bereichen deutlich verbessert, insbesondere in Bezug auf die Fähigkeiten in der Code-Erstellung, dem logischen Denken und dem visuellen Verständnis. Darüber hinaus erreicht das Modell bei der Steuerung des Stils komplexer Eingabeaufforderungen ein Niveau, das mit den derzeit führenden Modellen o1-preview und New Sonnet3.5 vergleichbar ist.

In praktischen Tests übertraf Gemini-Exp-1121 das neue GPT-4o sogar bei der Verarbeitung von Comic-Inhalten. Seine Antworten waren umfassender und präsentierten Informationen klar und strukturiert mit Unterüberschriften und Fettdruck.

Bei der klassischen logischen Denksportaufgabe mit Tieren, die einen Fluss überqueren, lieferte Gemini-Exp-1121 die vollständig korrekte Lösung und zeigte damit eine überlegene logische Schlussfolgerungsfähigkeit. Das neue GPT-4o hingegen machte einige Fehler.

Gleichzeitig arbeitet OpenAI aktiv an neuen Funktionen. In der neuesten Version von ChatGPT wurde kürzlich Code für eine „Live-Kamera“-Funktion entdeckt, was auf Fortschritte in der Sprach- und Bilderkennung hindeutet. OpenAI-Nutzer konnten diese Funktion erstmals im erweiterten Sprachmodus erleben, was darauf hindeutet, dass OpenAI beabsichtigt, den Anwendungsbereich dieser Funktion in Zukunft zu erweitern.

Es ist absehbar, dass sich die Hauptkommunikationsmethode mit Chatbots im nächsten Jahr von traditionellen Textdialogen hin zu Sprachinteraktionen und intelligenteren Agentendiensten verschieben wird. Diese Entwicklung könnte durch die Einführung der „Live-Kamera“-Funktion vorangetrieben werden.

Wichtigste Punkte:

📈 Googles neues Modell Gemini-Exp-1121 überholt GPT-4o und erobert erneut die Spitze der KI-Rangliste.

🔍 Gemini-Exp-1121 zeigt verbesserte Leistungen in Code-Erstellung, logischem Denken und visuellem Verständnis.

🎥 OpenAI entwickelt eine „Live-Kamera“-Funktion, die die zukünftige Interaktionsweise mit KI verändern könnte.