Gboard革新打字体验谷歌凭大模型实现"一键修复所有错误"

Gboard是Google为移动设备打造的智能键盘，通过统计解码提供流畅的打字体验。现在，Google研究团队又为它增添了一项创新功能"校对"，利用大型语言模型（LLM）的强大能力，实现了一键修复整个句子和段落错误的突破。

根据Google新发布的论文《校对:一键修复所有错误》，这项名为"校对"的Gboard新功能依托于服务器端LLM的支持，用户只需轻轻一按，就能无缝更正整个句子或段落中的各种错误，完全改变了传统的逐字修正体验。该功能目前已在Pixel8设备上推出，每天惠及数千名用户。

QQ截图20240620104503.png

这一系统包括数据生成、指标设计、模型调整和服务四个关键部分。研究团队通过复杂的错误合成框架生成模拟数据集，设计多个指标从不同角度评估模型，并借鉴InstructGPT的思路，先通过监督学习进行微调，再采用强化学习技术进行调整，显著提升了模型性能。

QQ截图20240620104510.png

此外，该模型部署在云端TPU V5上，通过量化、分桶、分段输入和推测解码等手段优化延迟，最终将中位响应时间降低了39.4%。

QQ截图20240620104521.png

分析人士认为，这一探索性研究充分展现了大模型为提升移动端输入交互体验所蕴藏的巨大潜能，是对传统人机交互方式的颠覆性革新。它标志着大模型在提升用户输入效率方面的变革力量，并对未来借助人工智能优化日常交互体验带来启示。

论文地址：https://arxiv.org/abs/2406.04523

AI新闻资讯