グーグルは最近、野生のアトランティックバンドウイルカのコミュニケーションパターンを深く理解することを目的とした、画期的なAIモデル「DolphinGemma」を発表しました。このプロジェクトは、グーグルと野生イルカプロジェクト(WDP)、ジョージア工科大学の研究者との共同開発で、WDPがバハマ諸島で40年近くにわたって蓄積してきた膨大なイルカの音声とビデオ記録データベースを活用しています。

DolphinGemmaはこれらの貴重なデータを用いてトレーニングされ、グーグルの先進的な音声技術であるSoundStreamセグメンターを使用してイルカの音声をデジタル形式に変換します。このAIモデルは、ホイッスル、クリック、パルス列など、イルカの典型的な音声パターンシーケンスを識別、分析、そしてリアルなものを生成することができ、人間の言語モデルと同様に、シーケンス内の次の音声を予測することができます。

QQ20250415-090936.png

画像出典:AI生成画像、画像ライセンス提供元Midjourney

特筆すべきは、研究者たちがグーグルPixelスマートフォンを使ってDolphinGemmaを直接水中に展開し、現地でのデータ記録と分析を行っていることです。同時に、チームはCHATシステム(鯨類聴覚増強テレメトリーシステム)を採用しており、このシステムは特注の人工ホイッスルを海藻やゲーム用具などの特定の物体と関連付けることで、イルカがこれらの音声を学習し、研究者との相互作用に使用することを目指しています。Pixelスマートフォンは、イルカが模倣する音調をリアルタイムで識別し、音声フィードバックをダイバーに送って、要求された物体を知らせます。

この革新的な研究計画は、人工知能、モバイル技術、長期間の現地観測を組み合わせ、イルカの言語構造を解明し、最終的には人間とイルカの間のある種のコミュニケーションを実現することを目標としています。グーグルは2025年夏にDolphinGemmaをオープンモデルとして公開し、他の研究チームが海洋哺乳類のコミュニケーション分析に利用できるようにする予定です。

DolphinGemmaは、グーグルが人工知能技術を動物のコミュニケーション研究(特に海洋哺乳類)に応用しようとするより広範な取り組みの一環です。「AI for Social Good」プロジェクトの一環として、グーグルはアメリカ海洋大気庁(NOAA)と協力して、2005年以来太平洋12カ所で記録された海洋哺乳類の鳴き声の水中聴音器データの分析を行うクジラ探知AIも開発しています。さらに、グーグルのAIモデルは最近、これまで知られていなかったブルースケールの鳴き声(「Biotwang」と呼ばれる)を特定するのに役立ちました。これは目撃情報と録音情報を組み合わせることで特定されました。

それだけでなく、地球種プロジェクトも、単一種と種間コミュニケーションを含む動物コミュニケーションの表現の作成に積極的に取り組んでおり、ミツバチのダンスを含むさまざまな非言語コミュニケーション形式の理解を目指しています。