O Gboard é o teclado inteligente do Google para dispositivos móveis, que oferece uma experiência de digitação fluida por meio de decodificação estatística. Agora, a equipe de pesquisa do Google adicionou a ele um recurso inovador chamado "Prova", que utiliza o poder dos grandes modelos de linguagem (LLMs) para alcançar o feito de corrigir erros em frases e parágrafos inteiros com apenas um clique.

De acordo com o novo artigo do Google, "Prova: Corrigindo todos os erros com um clique", este novo recurso do Gboard, chamado "Prova", se baseia no suporte de LLM do lado do servidor. Os usuários precisam apenas de um clique para corrigir perfeitamente vários erros em frases ou parágrafos inteiros, alterando completamente a experiência tradicional de correção palavra por palavra. A função está atualmente disponível em dispositivos Pixel 8 e beneficia milhares de usuários diariamente.

QQ截图20240620104503.png

Este sistema inclui quatro partes principais: geração de dados, design de métricas, ajuste de modelo e serviço. A equipe de pesquisa gerou conjuntos de dados simulados por meio de uma estrutura complexa de síntese de erros, projetou várias métricas para avaliar o modelo de diferentes ângulos e, inspirando-se no InstructGPT, primeiro realizou um ajuste fino por meio de aprendizado supervisionado e, em seguida, usou técnicas de aprendizado por reforço para ajustar o modelo, melhorando significativamente seu desempenho.

QQ截图20240620104510.png

Além disso, o modelo é implantado em TPUs V5 na nuvem, otimizando a latência por meio de quantização, binning, entrada segmentada e decodificação preditiva, reduzindo o tempo de resposta mediano em 39,4%.

QQ截图20240620104521.png

Analistas acreditam que esta pesquisa exploratória demonstra plenamente o enorme potencial dos grandes modelos para melhorar a experiência de interação de entrada em dispositivos móveis, representando uma inovação disruptiva nas formas tradicionais de interação homem-máquina. Marca uma força transformadora na melhoria da eficiência de entrada do usuário e oferece insights para otimizar futuras experiências interativas diárias com a ajuda da inteligência artificial.

Endereço do artigo: https://arxiv.org/abs/2406.04523