Studie zeigt: Selbst die besten KI-Modelle produzieren viele Halluzinationen

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 3 Minuten Lesezeit · Aug 15, 2024

104

Forscher der Cornell University und anderer Institutionen haben kürzlich mehrere generative KI-Modelle, darunter GPT-4o, Claude und Gemini, einem Halluzinationstest unterzogen. Die Studie ergab, dass selbst die fortschrittlichsten Modelle nur in etwa 35 % der Fälle halluzinationsfreien Text generieren, was darauf hinweist, dass die Zuverlässigkeit von KI noch verbessert werden muss.

Die Forscher entwickelten einen Fragenkatalog mit Inhalten, die nicht in Wikipedia enthalten sind, und überprüften die Antworten anhand von autoritativen Quellen zu Themen wie Recht, Gesundheit und Geschichte. Die Ergebnisse zeigten, dass die Modelle von OpenAI insgesamt die beste Leistung erzielten, der Fortschritt im Vergleich zu der älteren Version GPT-3.5 jedoch begrenzt war. Interessanterweise hängt die Häufigkeit von Halluzinationen nicht von der Modellgröße ab: Kleinere Modelle wie Claude3Haiku schnitten ähnlich gut ab wie größere Modelle.

KI Künstliche Intelligenz Roboter

Bildquelle: Das Bild wurde mit KI generiert, Lizenzgeber: Midjourney

Die Mitverfasserin Zhao Wenting weist darauf hin, dass selbst Modelle mit Online-Suchfunktion Schwierigkeiten haben, „Nicht-Wikipedia“-Fragen zu beantworten, was den tiefgreifenden Einfluss von Wikipedia auf die Modelle verdeutlicht. Sie erwartet, dass das Problem der Halluzinationen „noch lange bestehen bleiben“ wird, teilweise weil die Trainingsdaten selbst fehlerhafte Informationen enthalten können.

Eine vorübergehende Lösung besteht darin, die Häufigkeit, mit der das Modell Fragen unbeantwortet lässt, zu erhöhen. Claude3Haiku erwies sich mit einer Beantwortungsrate von nur 72 % als das „ehrlichste“ Modell. Diese Strategie kann jedoch die Benutzerfreundlichkeit beeinträchtigen.

Zhao schlägt vor, dass die vollständige Beseitigung von Halluzinationen unrealistisch sein mag, das Problem aber durch manuelle Faktenprüfung, Angabe von Quellen usw. gemildert werden kann. Sie fordert die Entwicklung entsprechender Richtlinien, um die Beteiligung von menschlichen Experten bei der Überprüfung von KI-generierten Informationen zu gewährleisten.

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI setzt erneut Maßstäbe in der KI-Technologie mit dem neuen Modell gpt-4o-audio-preview. Dieses Modell beeindruckt nicht nur durch seine Fähigkeiten in der Sprachgenerierung und -analyse, sondern eröffnet auch neue Möglichkeiten für die Mensch-Maschine-Interaktion. Werfen wir einen genaueren Blick auf die Eigenschaften und potenziellen Anwendungen dieses innovativen Modells. Die Kernfunktionen von gpt-4o-audio-preview lassen sich in drei Bereiche unterteilen: Erstens erzeugt es auf Basis von Text natürliche und flüssige Sprachantworten, was Anwendungen wie Sprachassistenten und virtuellen Kundenservice zugutekommt.

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI hat in seiner API die Funktion für strukturierte Ausgaben hinzugefügt, um sicherzustellen, dass die generierten Ausgaben vollständig dem vorgegebenen JSON-Schema entsprechen. Dies erhöht die Zuverlässigkeit der API und die Genauigkeit der Anwendungen deutlich. Diese Funktion definiert nicht nur die Struktur des JSON, sondern gewährleistet auch die Genauigkeit der Ausgabe. Gleichzeitig wurden die Preise gesenkt: Die Eingangs-Kosten wurden halbiert und die Ausgabe-Kosten um ein Drittel reduziert. Die Einführung strukturierter Ausgaben behebt die Einschränkungen von JSON-Schemas bei der Gewährleistung der Konformität der Ausgaben mit einer bestimmten Struktur und verbessert die Leistung des Modells bei strukturierten Ausgaben erheblich. Durch technologische Innovationen, wie z.B. Beschränkungen...

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output

Das herausragende Merkmal des neuen OpenAI-Modells gpt-4o-64k-output-alpha ist die Möglichkeit, bis zu 64K Tokens in einem einzigen Output zu generieren. Dies eignet sich ideal für die Erstellung umfangreicher und detaillierter Inhalte und erfüllt die Anforderungen von Schreibaufgaben, Programmierung und komplexen Datenanalysen. Diese Funktion erhöht jedoch den API-Preis: Die Kosten für eine Million Output-Tokens betragen 18 US-Dollar, im Vergleich dazu kosten eine Million Input-Tokens nur 6 US-Dollar. Dies soll den hohen Rechenkosten entsprechen und einen verantwortungsvollen Umgang mit diesem leistungsstarken Tool fördern. Das Modell ist für die Bereiche Kreativität und Forschung konzipiert.

KI-Nachrichten und -Informationen

Studie zeigt: Selbst die besten KI-Modelle produzieren viele Halluzinationen

AIbase基地

Empfohlene verwandte KI-Nachrichten

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output