Gboardでタイピング体験を革新 Google、大規模言語モデルで「ワンタッチで全ての誤りを修正」を実現

AIbase

公開日AIニュース · 1 分で読めます · Jun 20, 2024

158

Gboardは、Googleがモバイルデバイス向けに開発したスマートキーボードで、統計的デコードによりスムーズなタイピング体験を提供しています。そして今、Googleの研究チームは、大規模言語モデル（LLM）の強力な能力を活用した革新的な機能「校正」を追加しました。これにより、文章や段落全体の誤りをワンクリックで修正するという飛躍的な進歩を実現しました。

Googleが新たに発表した論文「校正：ワンクリックで全ての誤りを修正」によると、「校正」機能はサーバー側のLLMによって支えられています。ユーザーはワンクリックするだけで、文章や段落全体の様々な誤りをシームレスに修正できます。従来の文字単位での修正とは全く異なる体験です。この機能は現在、Pixel 8デバイスで利用可能となっており、毎日数千人のユーザーがその恩恵を受けています。

QQ截图20240620104503.png

このシステムは、データ生成、指標設計、モデル調整、そしてサービスという4つの重要な部分から構成されています。研究チームは複雑なエラー合成フレームワークを用いて模擬データセットを生成し、複数の指標を設計することでモデルを多角的に評価しました。さらにInstructGPTの手法を参考に、まず教師あり学習で微調整を行い、その後強化学習技術を用いて調整することで、モデルの性能を大幅に向上させました。

QQ截图20240620104510.png

さらに、このモデルはクラウド上のTPU V5に展開されており、量子化、バケット化、セグメント化された入力、そして推測デコードなどの手法によって遅延を最適化しました。その結果、中央値応答時間は39.4％短縮されました。

QQ截图20240620104521.png

アナリストによると、この探求的な研究は、大規模モデルがモバイル端末の入力インタラクション体験を向上させる上で計り知れない可能性を秘めていることを明確に示しており、従来の人間と機械のインタラクション方法に革命を起こすものです。これは、ユーザーの入力効率を向上させる上での大規模モデルの変革力を示すものであり、将来の人工知能を活用した日常的なインタラクション体験の最適化への示唆を与えてくれます。

論文アドレス：https://arxiv.org/abs/2406.04523

Manus創業者季逸超氏：Manus製品は阿里ババの千問大規模言語モデルに基づき開発

中国のスタートアップ企業Monicaが発表したAIエージェント製品Manusが、Xプラットフォームで最近話題になっています。その創業者である季逸超（Ji Yichao）氏は本日、ソーシャルメディアを通じて製品の技術詳細をさらに明らかにしました。季氏によると、Manusは阿里巴巴の千問(Qwen)大規模言語モデルに基づいて開発されており、複数の微調整モデルを用いて独自の機能を実現しています。この発表は、Manusの技術ソースに関する議論を引き起こしただけでなく、世界中のAIコミュニティにおけるその潜在力への関心をさらに高めています。季氏

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

バイトダンス傘下の豆包大規模言語モデルチームは先日、混合専門家モデル（MoE）アーキテクチャにおける主要なボトルネックを克服し、COMETという名称の重要な最適化技術をオープンソース化したと発表しました。この技術は、大規模言語モデルのトレーニング効率を大幅に向上させ、最大1.7倍の効率向上を実現し、トレーニングコストを40％削減することに成功しました。画像注記：画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを使用しています。COMET技術は、バイトダンスの万規模GPUクラスタトレーニングで実際に適用されており、数百万GPU時間の節約に貢献しています。

智元、家庭用ロボットベースの大規模言語モデルGO-1を発表成功率が大幅に向上

3月10日、智元ロボットは、初の汎用具象ベースの大規模言語モデルであるGenie Operator-1（GO-1と略称）を発表しました。この発表は大きな注目を集め、特に家庭用サービスロボットの可能性という点において、将来の家事管理に新たな希望をもたらすものとして期待されています。智元ロボットの公式発表によると、GO-1大規模言語モデルは大量の人間のビデオ学習を通じて、コップの水を運ぶ、食事を作る、客を迎えるなど、多くの家事タスクをこなす優れた能力を示しています。技術性能に関しては、