Kürzlich gab Google die Open-Source-Veröffentlichung seines Text-Wasserzeichen-Tools SynthID bekannt, um Entwickler bei der besseren Erkennung von KI-generierten Texten zu unterstützen. Dieses Tool ist jetzt über Googles „Responsible AI“-Toolkit öffentlich zugänglich.

Pushmeet Kohli, Vizepräsident für Forschung bei Google DeepMind, erklärte, dass diese Technologie es anderen Entwicklern generativer KI ermöglichen wird, zu erkennen, ob Textausgaben von ihren eigenen großen Sprachmodellen (LLMs) stammen. Dies wird ihnen helfen, KI-Anwendungen verantwortungsbewusster zu entwickeln.

In der heutigen Zeit der schnellen Informationsverbreitung ist die Wasserzeichen-Technologie besonders wichtig. Da große Sprachmodelle zur Verbreitung politischer Falschinformationen und zur Erstellung unangemessener Inhalte verwendet werden, steigt auch der Bedarf an Wasserzeichen-Tools. So erwägt beispielsweise Kalifornien, KI-Wasserzeichen zur Pflicht zu machen, während China dies bereits im vergangenen Jahr eingeführt hat. Dennoch befindet sich die entsprechende Technologie noch in der Weiterentwicklung.

Googles SynthID-Technologie wurde erstmals im August letzten Jahres vorgestellt. Sie fügt unsichtbare Wasserzeichen in generierte Texte, Bilder, Audio- und Videodateien ein, um die Erkennung von KI-generierten Ausgaben zu erleichtern.

Konkret passt SynthID die Wahrscheinlichkeit jedes generierten Wortes im Textausgabe fein ab, sodass diese Änderungen in der Software erkannt, aber vom Menschen nicht wahrgenommen werden. Wenn das Modell beispielsweise „Meine Lieblings-Tropenfrucht ist __.“ generiert, könnte es Wörter wie „Mango“, „Litschi“, „Papaya“ oder „Durian“ auswählen. Jedes Wort hat einen Wahrscheinlichkeitsscore, und SynthID passt diese Scores an, ohne die Qualität, Genauigkeit und Kreativität des Textes zu beeinträchtigen.

Diese Anpassung findet im gesamten generierten Text statt, daher kann ein Text mehr als zehn angepasste Scores aufweisen, während eine ganze Seite Hunderte enthalten kann. Schließlich bilden diese angepassten Wahrscheinlichkeitsscore-Muster das Wasserzeichen. Google gibt an, dass das System in seinen Gemini-Chatbot integriert ist und die Qualität und Geschwindigkeit des generierten Texts nicht beeinträchtigt. Es gibt jedoch noch einige Herausforderungen bei kurzen Texten, überarbeiteten oder übersetzten Inhalten sowie bei Antworten auf Faktenfragen.

Google stellte in einem Blogbeitrag fest: „SynthID ist kein Allheilmittel zur Erkennung von KI-generierten Inhalten, aber es ist ein wichtiger Baustein für die Entwicklung zuverlässigerer KI-Erkennungstools, die Millionen von Nutzern helfen können, fundiertere Entscheidungen zu treffen.“

Projektseite:https://ai.google.dev/responsible/docs/safeguards/synthid?hl=de

Wichtigste Punkte:

📜 SynthID Open Source, hilft Entwicklern bei der Erkennung von KI-generierten Texten.

🛠️ Wasserzeichen-Technologie wird immer wichtiger im Kampf gegen Falschinformationen und unangemessene Inhalte.

💡 Googles SynthID kann die Wahrscheinlichkeitsscores der Textgenerierung feinabstimmen und so ein Wasserzeichen erstellen.