Gboard revoluciona a experiência de digitação: Google usa modelos de linguagem grandes para 'corrigir todos os erros de uma só vez'

AIbase

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Jun 20, 2024

158

O Gboard é o teclado inteligente do Google para dispositivos móveis, que oferece uma experiência de digitação fluida por meio de decodificação estatística. Agora, a equipe de pesquisa do Google adicionou a ele um recurso inovador chamado "Prova", que utiliza o poder dos grandes modelos de linguagem (LLMs) para alcançar o feito de corrigir erros em frases e parágrafos inteiros com apenas um clique.

De acordo com o novo artigo do Google, "Prova: Corrigindo todos os erros com um clique", este novo recurso do Gboard, chamado "Prova", se baseia no suporte de LLM do lado do servidor. Os usuários precisam apenas de um clique para corrigir perfeitamente vários erros em frases ou parágrafos inteiros, alterando completamente a experiência tradicional de correção palavra por palavra. A função está atualmente disponível em dispositivos Pixel 8 e beneficia milhares de usuários diariamente.

QQ截图20240620104503.png

Este sistema inclui quatro partes principais: geração de dados, design de métricas, ajuste de modelo e serviço. A equipe de pesquisa gerou conjuntos de dados simulados por meio de uma estrutura complexa de síntese de erros, projetou várias métricas para avaliar o modelo de diferentes ângulos e, inspirando-se no InstructGPT, primeiro realizou um ajuste fino por meio de aprendizado supervisionado e, em seguida, usou técnicas de aprendizado por reforço para ajustar o modelo, melhorando significativamente seu desempenho.

QQ截图20240620104510.png

Além disso, o modelo é implantado em TPUs V5 na nuvem, otimizando a latência por meio de quantização, binning, entrada segmentada e decodificação preditiva, reduzindo o tempo de resposta mediano em 39,4%.

QQ截图20240620104521.png

Analistas acreditam que esta pesquisa exploratória demonstra plenamente o enorme potencial dos grandes modelos para melhorar a experiência de interação de entrada em dispositivos móveis, representando uma inovação disruptiva nas formas tradicionais de interação homem-máquina. Marca uma força transformadora na melhoria da eficiência de entrada do usuário e oferece insights para otimizar futuras experiências interativas diárias com a ajuda da inteligência artificial.

Endereço do artigo: https://arxiv.org/abs/2406.04523

Criador da Manus, Ji Yichao: Produtos Manus são desenvolvidos com base no modelo de linguagem grande Qwen da Alibaba

O produto Manus, um agente de IA lançado pela startup chinesa Monica, recentemente causou furor na plataforma X. Hoje, seu fundador, Ji Yichao, divulgou mais detalhes técnicos do produto nas redes sociais. De acordo com Ji Yichao, Manus é desenvolvido com base no modelo de linguagem grande Qwen da Alibaba e utiliza vários modelos de ajuste fino para alcançar suas funcionalidades exclusivas. Essa notícia não apenas gerou discussões na indústria sobre a origem da tecnologia da Manus, mas também aumentou o interesse da comunidade global de IA em seu potencial. Ji Yichao

CSN Steel integra com sucesso o modelo de linguagem grande DeepSeek-R1, impulsionando a transformação digital

A CSN Steel deu um passo importante em sua jornada de transformação digital, anunciando recentemente em sua plataforma de interação a integração bem-sucedida do modelo de linguagem grande DeepSeek-R1. A empresa afirmou que, no futuro, se dedicará a promover a profunda integração entre tecnologia digital e economia real, usando isso como base para reformas abrangentes, buscando acelerar a construção de ativos de dados e explorar o valor potencial dos dados. Os esforços da CSN Steel para promover a manutenção inteligente representam uma estratégia crucial em um mercado competitivo. Com a integração do modelo de linguagem grande DeepSeek-R1, o 'Mensageiro CSN Steel'...

Ultrapassando o DeepSeek-R1! O modelo de linguagem grande Wanxiang da Alibaba assume a liderança no ranking global de código aberto

De acordo com o ranking mais recente divulgado pela comunidade de código aberto Hugging Face, o modelo de linguagem grande Wanxiang, lançado pela Alibaba, ultrapassou o DeepSeek-R1 apenas seis dias após seu lançamento em código aberto, assumindo a liderança em duas importantes listas de classificação: ranking de modelos populares e ranking de espaço de modelos. Essa conquista não apenas demonstra o desempenho técnico excepcional do modelo de linguagem grande Wanxiang, mas também reflete seu amplo reconhecimento e influência na comunidade global de código aberto.

Notícias e Informações de IA

Gboard revoluciona a experiência de digitação: Google usa modelos de linguagem grandes para 'corrigir todos os erros de uma só vez'

AIbase

Notícias de IA Relacionadas Recomendadas

Criador da Manus, Ji Yichao: Produtos Manus são desenvolvidos com base no modelo de linguagem grande Qwen da Alibaba

Em apenas quatro semanas! A Foxconn lança o modelo de linguagem grande em chinês FoxBrain

CSN Steel integra com sucesso o modelo de linguagem grande DeepSeek-R1, impulsionando a transformação digital

Ultrapassando o DeepSeek-R1! O modelo de linguagem grande Wanxiang da Alibaba assume a liderança no ranking global de código aberto