OpenAI präsentiert multimodales Modell GPT-Vision als Konkurrenz zu Googles Gemini

站长之家

Veröffentlicht amKI-Nachrichten und -Informationen · 1 Minuten Lesezeit · Sep 20, 2023

OpenAI und Google im KI-Wettlauf

OpenAI bereitet die Einführung von GPT-Vision vor, einem multimodalen Modell, das mit Googles Gemini konkurrieren soll. GPT-Vision erweitert die Fähigkeiten von GPT-4 im Umgang mit Bildern und ermöglicht die Generierung von Texten, die sich auf den Bildinhalt beziehen.

Darüber hinaus entwickelt OpenAI ein multimodales KI-Modell namens Gobi, das möglicherweise als GPT-5 Nachfolger fungieren wird.

Auf der Entwicklerkonferenz am 6. November plant OpenAI, neue Funktionen von GPT-4 vorzustellen.

Der Wettbewerb zwischen OpenAI und Google wird den Fortschritt der KI-Technologie vorantreiben, wovon letztendlich die Verbraucher profitieren.

Amerikacup-Segeln visualisiert Wind mit KI

Bei der 37. America's Cup wurde das Programm WindSightIQ erstmals in die Fernsehübertragung integriert. Mithilfe von Lidar, Sensorfusion und wissenschaftlichen Berechnungen visualisiert es das Windfeld als Augmented- und Virtual-Reality-Grafiken und hilft Zuschauern, die entscheidenden Windfaktoren beim Segeln zu verstehen. Obwohl die Segler weiterhin auf ihr Instinkt und ihr Training angewiesen sind, um Routen zu planen, können Kommentatoren und Zuschauer nun Windmuster in Echtzeit sehen, tatsächliche Leistungen mit optimalen Pfaden vergleichen und so auf einer nie dagewesenen Ebene am Rennen teilnehmen. Diese Innovation bietet ein völlig neues Seherlebnis und macht den normalerweise unsichtbaren Wind sichtbar.

KI-Nachrichten und -Informationen

OpenAI präsentiert multimodales Modell GPT-Vision als Konkurrenz zu Googles Gemini

站长之家

Empfohlene verwandte KI-Nachrichten

Amerikacup-Segeln visualisiert Wind mit KI