Google hat kürzlich ein bahnbrechendes KI-Modell namens DolphinGemma veröffentlicht, das darauf abzielt, die Kommunikationsmuster von wilden Atlantischen Tümmlern zu verstehen. Das Projekt wurde in Zusammenarbeit von Google mit dem Wild Dolphin Project (WDP) und Forschern des Georgia Institute of Technology entwickelt und nutzt die umfangreiche Datenbank an Audio- und Videoaufnahmen von Delfinen, die das WDP in den letzten 40 Jahren auf den Bahamas gesammelt hat.
DolphinGemma wurde auf der Grundlage dieser wertvollen Daten trainiert und verwendet Googles fortschrittliche Audiotechnologie SoundStream, um die Delfingeräusche in ein digitales Format umzuwandeln. Das KI-Modell kann typische Klangmuster von Delfinen, einschließlich Pfeiflaute, Klicklaute und Impulsserien, erkennen, analysieren und sogar realistisch generieren. Ähnlich wie menschliche Sprachmodelle kann es den nächsten Laut in einer Sequenz vorhersagen.
Bildquelle: KI-generiertes Bild, Lizenziert von Midjourney
Bemerkenswert ist, dass die Forscher DolphinGemma mithilfe von Google Pixel Smartphones direkt unter Wasser einsetzen, um Daten vor Ort aufzuzeichnen und zu analysieren. Gleichzeitig verwendet das Team das CHAT-System (Cetacean Acoustic Enhancement Telemetry System), das speziell entwickelte künstliche Pfeiflaute mit bestimmten Objekten wie Seetang oder Spielzeug verbindet. Ziel ist es, die Delfine zu lehren, diese Laute zu verwenden, um mit den Forschern zu interagieren. Das Pixel Smartphone kann die von den Delfinen imitierten Töne in Echtzeit erkennen und gibt den Tauchern über akustisches Feedback Bescheid, welches Objekt angefordert wurde.
Dieses innovative Forschungsprojekt kombiniert künstliche Intelligenz, mobile Technologie und langjährige Feldbeobachtungen mit dem Ziel, die Struktur der Delfinsprache aufzudecken und letztendlich eine Form der Kommunikation zwischen Mensch und Delfin zu ermöglichen. Google plant, DolphinGemma im Sommer 2025 als Open-Source-Modell zu veröffentlichen, damit andere Forschungsteams die Kommunikation von Meeressäugern analysieren können.
DolphinGemma ist Teil der umfassenderen Bemühungen von Google, seine KI-Technologie auf die Erforschung der Tierkommunikation, insbesondere bei Meeressäugern, anzuwenden. Im Rahmen seines „AI for Social Good“-Projekts arbeitet Google auch mit der National Oceanic and Atmospheric Administration (NOAA) zusammen, um eine KI zur Waldetektion zu entwickeln, die Hydrophondaten von Meeressäugerlauten analysiert, die seit 2005 an 12 Standorten im Pazifik aufgezeichnet wurden. Darüber hinaus hat ein KI-Modell von Google kürzlich dazu beigetragen, einen bisher unbekannten Laut von Brydewalen zu identifizieren, ein als „Biotwang“ bezeichnetes Geräusch, das durch die Kombination von Sichtungen und Aufnahmen bestimmt wurde.
Darüber hinaus arbeitet das Earth Species Project aktiv an der Erstellung von Darstellungen der Tierkommunikation, die sowohl die Kommunikation einzelner Arten als auch die zwischen verschiedenen Arten umfasst. Das Ziel ist es, verschiedene Formen der nicht-verbalen Kommunikation zu verstehen, einschließlich des Bienentanzes.