Am 25. September veröffentlichte OpenAI für seinen beliebten Chatbot ChatGPT neue Funktionen für die Mehrmodalität, darunter Sprachinteraktion und Bilderkennung. Die neuen Funktionen ermöglichen es Nutzern, über Sprachbefehle und hochgeladene Bilder zu interagieren und bieten Funktionen wie Spracherkennung, Texterkennung und Objekterkennung. Die multimodalfähige Version von ChatGPT wird GPT-4V genannt und wurde gleichzeitig mit GPT-4 trainiert. Aus Sicherheitsgründen wurde die Veröffentlichung jedoch verschoben. OpenAI gab an, dass die neuen Funktionen zunächst für ChatGPT Plus-Abonnenten und Unternehmenskunden verfügbar sein werden.
OpenAI ChatGPT erhält Multimodalitätsfunktionen: Sprachinteraktion und Bilderkennung

智能涌现
79
© Alle Rechte vorbehalten AIbase-Basis 2024, klicken Sie hier, um die Quelle anzuzeigen - https://www.aibase.com/de/news/1695