Eine aktuelle Studie zeigt, dass Leser Schwierigkeiten haben, zwischen Gedichten von menschlichen Dichtern und von künstlicher Intelligenz (KI) generierten Gedichten zu unterscheiden. Überraschenderweise bewerteten viele Teilnehmer die von KI erstellten Gedichte sogar höher als die Werke berühmter Dichter. Die Studie wurde von Brian Porter, einem Postdoktoranden der Universität Pittsburgh, und seinem Team durchgeführt und diese Woche in „Nature Scientific Reports“ veröffentlicht.
Bildquelle: Das Bild wurde von KI generiert und stammt vom Bildlizenzgeber Midjourney.
Das Forschungsteam wählte zehn berühmte Dichter der englischen Literatur aus, darunter Geoffrey Chaucer, William Shakespeare und Walt Whitman, und umfasste Werke aus fast 700 Jahren Literaturgeschichte. Um die Unterschiede zwischen KI- und menschlichen Gedichten zu untersuchen, ließen die Forscher das OpenAI ChatGPT 3.5-Modell fünf Gedichte pro Dichter generieren. Bemerkenswert ist, dass die generierten Gedichte nicht von Menschen kuratiert wurden; die Forscher verwendeten die ersten fünf vom Modell generierten Gedichte direkt.
Die Studie bestand aus zwei Teilen. Im ersten Teil wurden 1634 Teilnehmer zufällig einer der Dichter zugeordnet und lasen zehn Gedichte in zufälliger Reihenfolge – fünf von KI generiert und fünf von Menschen geschrieben. Die Teilnehmer sollten den Autor jedes Gedichts als KI oder Mensch identifizieren. Die Ergebnisse zeigten, dass die Teilnehmer eher dazu neigten, KI-generierte Gedichte als von Menschen geschrieben einzustufen, während sie Gedichte, die tatsächlich von Menschen stammten, eher als KI-generiert einstuften.
Der zweite Teil der Studie umfasste fast 700 Teilnehmer, die 14 Aspekte der Gedichte wie Qualität, Ästhetik, Emotionen, Rhythmus und Originalität bewerteten. Die Teilnehmer wurden zufällig in drei Gruppen aufgeteilt: Eine Gruppe wurde darüber informiert, dass die Gedichte von Menschen stammten, eine andere, dass sie von KI stammten, und die letzte Gruppe erhielt keine Informationen. Die Ergebnisse zeigten, dass die Teilnehmer ohne vorherige Information den KI-generierten Gedichten im Allgemeinen höhere Punktzahlen gaben. Wenn die Teilnehmer jedoch wussten, dass die Gedichte von KI stammten, neigten sie dazu, niedrigere Punktzahlen zu vergeben.
Die Forscher erklären, dass diese Ergebnisse darauf hindeuten, dass die Teilnehmer bei der Unterscheidung zwischen KI- und menschlichen Gedichten gängige, aber unzuverlässige Beurteilungskriterien verwendeten. KI-generierte Gedichte sind aufgrund ihrer relativen Einfachheit möglicherweise leichter für Laien zu verstehen, was dazu führt, dass sie KI-Werke bevorzugen und die Komplexität menschlicher Gedichte als sinnlos missverstehen. Die Ergebnisse dieser Studie zeigen, dass die Fähigkeiten der KI im Bereich der Poesie ein Niveau erreicht haben, das von menschlichen Werken kaum zu unterscheiden ist.
Wichtigste Punkte:
🌟 Die Studie zeigt, dass Leser kaum zwischen Gedichten von Menschen und KI unterscheiden können und letztere sogar bevorzugen.
📊 Teilnehmer verwechselten KI-generierte Gedichte oft mit menschlichen Werken.
📉 Die Bewertung von KI-Gedichten war im Allgemeinen höher als die von menschlichen Gedichten, insbesondere wenn der Autor unbekannt war.