先日終了したMWC展示会で、GoogleはGemini Liveの新機能を発表し、Project AstraとGemini Liveの統合を実現しました。この新機能により、ユーザーはスマホ画面の共有だけでなく、スマホカメラを使ったリアルタイムのビデオインタラクションも可能になり、AIアシスタントの使い勝手を大幅に向上させる大きな飛躍となります。

Googleの広報担当者Alex Joseph氏はメールでこのニュースを伝え、新機能がユーザーに展開開始されたことを明らかにしました。「Share screen with Live」という新しいボタンで、ユーザーは簡単にスマホ画面を共有できます。Redditユーザーの一人が既にこの機能を試用し、その様子を動画で公開しています。動画では、Geminiがユーザーが共有した画面情報に基づき、今日の日付や現在の気温などを正確に回答しています。

Googleの大規模言語モデルGemini

画面共有機能に加え、Gemini Liveはリアルタイムビデオ解釈機能も搭載しました。スマホカメラを起動するだけで、Geminiは撮影された画像を解析し、関連する質問に答えます。Googleが公開したデモ動画では、ユーザーがGeminiに釉薬をかけた陶器に最適な絵の具を尋ねると、ほぼ遅延なく詳細なアドバイスを提供し、その強力なリアルタイム処理能力を披露しました。

Project AstraはGoogleが昨年発表したAIアシスタントプロジェクトで、大規模モデルとのリアルタイムの視覚・音声インタラクションを目指しています。その主な特徴は、低遅延の音声・ビデオ会話、多言語対応、過去の会話の重要な詳細を記憶する機能、そして会話の中でGoogle検索やマップなどのツールを使用できる点です。さらに特筆すべきは、Project Astraがデバイスを跨いで使用できることで、Androidスマホや専用のメガネでこの機能を楽しむことができます。

Googleの急速な進歩とは対照的に、AppleはSiriのアップデートで停滞しています。ブルームバーグの報道によると、Apple幹部は内部会議で、SiriのAI機能のアップデートが目標に遠く及ばず、約束されたApple Intelligenceも実現の見込みがないことを認めています。このような進捗速度は、Appleの人工知能競争における遅れを示唆しています。

Googleの新機能のリリースは、同社の人工知能アシスタント分野における強力な地位を示すと同時に、未来のAIインタラクションへの期待を高めます。Appleが課題に直面しているとはいえ、業界競争の激化はさらなるイノベーションと改善を促し、最終的には多くのユーザーが恩恵を受けるでしょう。