Gboard, le clavier intelligent de Google pour appareils mobiles, offre une expérience de frappe fluide grâce au décodage statistique. Aujourd'hui, l'équipe de recherche Google y ajoute une fonctionnalité innovante : « Correction », qui exploite la puissance des grands modèles linguistiques (LLM) pour corriger les erreurs de phrases et de paragraphes entiers en un seul clic.

Selon le nouveau document de Google, intitulé « Correction : Correction d'erreurs en un seul clic », cette nouvelle fonctionnalité de Gboard, nommée « Correction », s'appuie sur un LLM côté serveur. D'un simple clic, les utilisateurs peuvent corriger sans effort toutes sortes d'erreurs dans une phrase ou un paragraphe entier, bouleversant ainsi l'expérience traditionnelle de correction caractère par caractère. Cette fonctionnalité est actuellement disponible sur les appareils Pixel 8 et bénéficie chaque jour à des milliers d'utilisateurs.

QQ截图20240620104503.png

Ce système comprend quatre parties clés : la génération de données, la conception des indicateurs, l'ajustement du modèle et le service. L'équipe de recherche a généré un ensemble de données simulées grâce à un cadre complexe de synthèse d'erreurs, conçu plusieurs indicateurs pour évaluer le modèle sous différents angles, et s'est inspirée d'InstructGPT en utilisant d'abord l'apprentissage supervisé pour l'ajustement fin, puis l'apprentissage par renforcement, améliorant ainsi considérablement les performances du modèle.

QQ截图20240620104510.png

De plus, le modèle est déployé sur des TPU V5 cloud, et des techniques d'optimisation de la latence telles que la quantification, le binning, l'entrée segmentée et le décodage spéculatif ont permis de réduire le temps de réponse médian de 39,4 %.

QQ截图20240620104521.png

Selon les analystes, cette recherche exploratoire met pleinement en évidence l'énorme potentiel des grands modèles pour améliorer l'expérience interactive de saisie sur les appareils mobiles, révolutionnant les méthodes traditionnelles d'interaction homme-machine. Elle marque une avancée majeure dans l'amélioration de l'efficacité de la saisie des utilisateurs et offre des perspectives sur l'optimisation future de l'expérience interactive quotidienne grâce à l'intelligence artificielle.

Adresse de l'article : https://arxiv.org/abs/2406.04523