Gboard, el teclado inteligente de Google para dispositivos móviles, ofrece una experiencia de escritura fluida mediante decodificación estadística. Ahora, el equipo de investigación de Google ha añadido una innovadora función de "corrección", que aprovecha la potencia de los modelos lingüísticos grandes (LLM) para lograr el avance de corregir errores en oraciones y párrafos enteros con un solo clic.

Según el nuevo artículo de Google, "Corrección: Corrección de todos los errores con un solo clic", esta nueva función de Gboard, llamada "Corrección", se basa en el apoyo de un LLM del lado del servidor. Con solo un clic, los usuarios pueden corregir sin problemas varios errores en oraciones o párrafos completos, cambiando por completo la experiencia tradicional de corrección carácter por carácter. Esta función ya está disponible en los dispositivos Pixel 8 y beneficia a miles de usuarios diariamente.

QQ截图20240620104503.png

Este sistema incluye cuatro partes clave: generación de datos, diseño de métricas, ajuste del modelo y servicio. El equipo de investigación generó conjuntos de datos simulados mediante un complejo marco de síntesis de errores, diseñó varias métricas para evaluar el modelo desde diferentes perspectivas y, basándose en la idea de InstructGPT, primero realizó un ajuste fino mediante aprendizaje supervisado y luego utilizó técnicas de aprendizaje por refuerzo para mejorar significativamente el rendimiento del modelo.

QQ截图20240620104510.png

Además, el modelo se implementa en TPU V5 en la nube, optimizando la latencia mediante cuantificación, agrupación, entrada segmentada y decodificación predictiva, lo que reduce el tiempo de respuesta medio en un 39,4%.

QQ截图20240620104521.png

Los analistas consideran que esta investigación exploratoria demuestra el enorme potencial de los grandes modelos para mejorar la experiencia de interacción de entrada en dispositivos móviles, representando una innovación revolucionaria en las formas tradicionales de interacción hombre-máquina. Marca un cambio transformador en la eficiencia de entrada del usuario gracias a los grandes modelos, y ofrece ideas para optimizar la experiencia de interacción diaria con la ayuda de la inteligencia artificial en el futuro.

Enlace al artículo: https://arxiv.org/abs/2406.04523