筋萎縮性側索硬化症(ALS)などの運動障害を持つ患者にとって、日常のコミュニケーションは困難を極めます。従来の補助的コミュニケーションツールでは、眼球運動によるタイピングにおける頻繁なキー操作が、眼精疲労と時間コストの増大につながり、効率的な解決策とはなりませんでした。この問題を解決するため、Googleの研究チームは、大規模言語モデル(LLM)と会話コンテキストを活用し、ALS患者のコミュニケーション効率を大幅に向上させる「SpeakFaster」というユーザーインターフェース(UI)を開発しました。

QQ20241125-111526.png

SpeakFasterは、ユーザーが入力しようとしている頭文字を予測し、会話の文脈に基づいてそれを完全なフレーズに展開することで、眼球運動によるタイピングにおけるキー操作回数を最大57%削減し、従来の方法と比較してテキスト入力速度を29~60%向上させました。微調整されたLLMと3つの異なる入力経路を組み合わせることで、最初の予測が失敗した場合でも、ユーザーは簡単に適切なフレーズを見つけることができ、入力速度の向上と不要な操作の削減を実現しています。

QQ20241125-111536.png

さらに、シミュレーション実験だけでなく、ALS患者を対象とした実験でも、SpeakFasterはキー操作の削減とタイピング速度の向上を実証しました。特にスクリプトシナリオでは、ALS患者の入力速度が61.3%向上しました。初期の学習曲線はやや急峻ですが、ほとんどのユーザーは15回の練習後には快適なタイピング速度に達することができました。

AI研究 AI医療 医生

画像出典:AI生成画像、画像ライセンスプロバイダーMidjourney

SpeakFasterは、コンテキストを認識するAI予測と代替入力方法を組み合わせることで、既存技術と比較して、運動障害を持つ患者に、より効率的で正確なコミュニケーション手段を提供し、社会参加度と生活の質を大幅に向上させます。