Google a récemment dévoilé DolphinGemma, un modèle d’intelligence artificielle révolutionnaire visant à comprendre en profondeur les modes de communication des dauphins à flancs blancs de l’Atlantique. Ce projet, développé en collaboration avec le Wild Dolphin Project (WDP) et des chercheurs du Georgia Institute of Technology, exploite une vaste base de données d’enregistrements audio et vidéo de dauphins accumulés par le WDP aux Bahamas sur près de 40 ans.

DolphinGemma est entraîné sur ces précieuses données et utilise le segmentateur audio avancé de Google, SoundStream, pour convertir les sons des dauphins en format numérique. Ce modèle d’IA est capable d’identifier, d’analyser et même de générer des séquences réalistes de vocalisations typiques des dauphins, notamment des sifflements, des clics et des séries d’impulsions. Fonctionnant de manière similaire aux modèles linguistiques humains, il peut prédire le son suivant dans une séquence.

QQ20250415-090936.png

Source : Image générée par IA, fournie par Midjourney

Il est intéressant de noter que les chercheurs utilisent des smartphones Google Pixel pour déployer DolphinGemma directement sous l’eau, afin d’enregistrer et d’analyser des données sur le terrain. Parallèlement, l’équipe utilise le système CHAT (système de télémétrie acoustique améliorée pour les cétacés), qui associe des sifflements artificiels spécifiques à des objets tels que des algues ou des jouets, afin d’inciter les dauphins à apprendre et à utiliser ces sons pour interagir avec les chercheurs. Le smartphone Pixel peut identifier en temps réel les tonalités imitées par les dauphins et fournir un retour sonore aux plongeurs, leur indiquant l’objet demandé.

Ce programme de recherche innovant associe l’intelligence artificielle, les technologies mobiles et des observations sur le terrain de longue durée. L’objectif est de révéler la structure du langage des dauphins et, à terme, de parvenir à une forme de communication entre les humains et les dauphins. Google prévoit de publier DolphinGemma en tant que modèle ouvert à l’été 2025, afin que d’autres équipes de recherche puissent l’utiliser pour analyser la communication des mammifères marins.

DolphinGemma fait partie des efforts plus vastes de Google pour appliquer ses technologies d’IA à la recherche sur la communication animale, en particulier chez les mammifères marins. Dans le cadre de son projet « IA pour le bien social », Google collabore également avec la NOAA (National Oceanic and Atmospheric Administration) pour développer une IA de détection des baleines, utilisée pour analyser les données d’hydrophones enregistrant les vocalisations de mammifères marins à 12 endroits du Pacifique depuis 2005. De plus, un modèle d’IA de Google a récemment permis d’identifier un cri de baleine de Bryde jusque-là inconnu, appelé « Biotwang », identifié grâce à la combinaison d’observations et d’enregistrements.

Enfin, le Earth Species Project travaille activement à la création de représentations de la communication animale, englobant la communication au sein d’une même espèce et entre espèces différentes. L’objectif est de comprendre diverses formes de communication non verbale, y compris la danse des abeilles.