KI-Nachrichten und -Informationen

KI-Produkt-Charts

OpenAI ChatGPT erhält Multimodalitätsfunktionen: Sprachinteraktion und Bilderkennung

智能涌现

Veröffentlicht amKI-Nachrichten und -Informationen · 1 Minuten Lesezeit · Sep 26, 2023

Am 25. September veröffentlichte OpenAI für seinen beliebten Chatbot ChatGPT neue Funktionen für die Mehrmodalität, darunter Sprachinteraktion und Bilderkennung. Die neuen Funktionen ermöglichen es Nutzern, über Sprachbefehle und hochgeladene Bilder zu interagieren und bieten Funktionen wie Spracherkennung, Texterkennung und Objekterkennung. Die multimodalfähige Version von ChatGPT wird GPT-4V genannt und wurde gleichzeitig mit GPT-4 trainiert. Aus Sicherheitsgründen wurde die Veröffentlichung jedoch verschoben. OpenAI gab an, dass die neuen Funktionen zunächst für ChatGPT Plus-Abonnenten und Unternehmenskunden verfügbar sein werden.

ChatGPT OpenAI Multimodal

Empfohlene verwandte KI-Nachrichten

¡Gran avance en la IA de avatares digitales! Hedra lanza Character-3 y Hedra Studio: inferencia conjunta de imagen, texto y audio

Hedra ha presentado Character-3 y Hedra Studio, dos innovaciones que marcan un hito en la tecnología de avatares digitales. Estos avances permiten la inferencia conjunta de imagen, texto y audio, abriendo nuevas posibilidades para la creación de experiencias inmersivas y realistas en diversas aplicaciones.

Mar 9, 2025

16.1k

Baidu Research veröffentlicht BGE-VL, ein multimodales Vektormodell – der Beginn einer neuen Ära der Informationsbeschaffung

Mar 7, 2025

16.1k

Cohere veröffentlicht neues multimodales KI-Modell Aya Vision in 32B- und 8B-Versionen

Mar 6, 2025

16.0k

Huake Byte präsentiert Liquid: Neudefinition der Generierung und des Verständnisses multimodaler Modelle

Mar 4, 2025

15.9k