Gboardは、Googleがモバイルデバイス向けに開発したスマートキーボードで、統計的デコードによりスムーズなタイピング体験を提供しています。そして今、Googleの研究チームは、大規模言語モデル(LLM)の強力な能力を活用した革新的な機能「校正」を追加しました。これにより、文章や段落全体の誤りをワンクリックで修正するという飛躍的な進歩を実現しました。

Googleが新たに発表した論文「校正:ワンクリックで全ての誤りを修正」によると、「校正」機能はサーバー側のLLMによって支えられています。ユーザーはワンクリックするだけで、文章や段落全体の様々な誤りをシームレスに修正できます。従来の文字単位での修正とは全く異なる体験です。この機能は現在、Pixel 8デバイスで利用可能となっており、毎日数千人のユーザーがその恩恵を受けています。

QQ截图20240620104503.png

このシステムは、データ生成、指標設計、モデル調整、そしてサービスという4つの重要な部分から構成されています。研究チームは複雑なエラー合成フレームワークを用いて模擬データセットを生成し、複数の指標を設計することでモデルを多角的に評価しました。さらにInstructGPTの手法を参考に、まず教師あり学習で微調整を行い、その後強化学習技術を用いて調整することで、モデルの性能を大幅に向上させました。

QQ截图20240620104510.png

さらに、このモデルはクラウド上のTPU V5に展開されており、量子化、バケット化、セグメント化された入力、そして推測デコードなどの手法によって遅延を最適化しました。その結果、中央値応答時間は39.4%短縮されました。

QQ截图20240620104521.png

アナリストによると、この探求的な研究は、大規模モデルがモバイル端末の入力インタラクション体験を向上させる上で計り知れない可能性を秘めていることを明確に示しており、従来の人間と機械のインタラクション方法に革命を起こすものです。これは、ユーザーの入力効率を向上させる上での大規模モデルの変革力を示すものであり、将来の人工知能を活用した日常的なインタラクション体験の最適化への示唆を与えてくれます。

論文アドレス:https://arxiv.org/abs/2406.04523