Gboard, Googles intelligente Tastatur für mobile Geräte, bietet durch statistische Decodierung ein flüssiges Tipperlebnis. Nun hat das Google-Forschungsteam eine innovative Funktion namens „Korrektur“ hinzugefügt, die mithilfe der Leistungsfähigkeit großer Sprachmodelle (LLMs) die Korrektur ganzer Sätze und Absätze mit nur einem Klick ermöglicht.

Laut Googles kürzlich veröffentlichter Arbeit „Korrektur: Alle Fehler mit einem Klick beheben“ basiert die neue Gboard-Funktion „Korrektur“ auf einem serverseitigen LLM. Mit nur einem Klick können Benutzer verschiedene Fehler in ganzen Sätzen oder Absätzen nahtlos korrigieren – ein deutlicher Unterschied zur traditionellen Korrektur Wort für Wort. Diese Funktion ist derzeit auf Pixel 8 Geräten verfügbar und unterstützt täglich Tausende von Nutzern.

QQ截图20240620104503.png

Das System umfasst vier Schlüsselkomponenten: Datengenerierung, Kennzahlenentwicklung, Modellanpassung und Service. Das Forschungsteam generierte mithilfe eines komplexen Fehlersyntheserahmens simulierte Datensätze, entwickelte mehrere Kennzahlen zur Bewertung des Modells aus verschiedenen Blickwinkeln und orientierte sich an InstructGPT. Zuerst wurde das Modell durch überwachtes Lernen feinabgestimmt und anschließend mithilfe von Reinforcement Learning optimiert, was zu einer deutlichen Leistungssteigerung führte.

QQ截图20240620104510.png

Darüber hinaus wird das Modell auf Cloud-TPU V5 bereitgestellt. Durch Quantisierung, Binning, segmentierte Eingaben und prädiktive Decodierung wurde die Latenz optimiert, wodurch die mittlere Antwortzeit um 39,4 % reduziert werden konnte.

QQ截图20240620104521.png

Analysten sind der Ansicht, dass diese explorative Studie das enorme Potenzial großer Modelle zur Verbesserung der Eingabeinteraktion auf mobilen Geräten deutlich aufzeigt und eine revolutionäre Veränderung der traditionellen Mensch-Computer-Interaktion darstellt. Sie markiert eine transformative Kraft großer Modelle bei der Steigerung der Benutzereingabeeffizienz und liefert Erkenntnisse für die zukünftige Optimierung der täglichen Interaktion mithilfe von künstlicher Intelligenz.

论文地址: https://arxiv.org/abs/2406.04523