Tencent publica nova patente para treinamento de modelos de linguagem de grande porte, melhorando a generalização e a precisão do modelo

Recentemente, a Tencent Technology (Shenzhen) Co., Ltd. divulgou no aplicativo Tianyancha uma patente sobre um método de treinamento de modelos de linguagem de grande porte e equipamentos relacionados. A patente, intitulada “Método de treinamento de modelos de linguagem de grande porte, dispositivo, equipamento de computador e meio de armazenamento”, visa melhorar a capacidade de aprendizado e a precisão dos modelos de linguagem de grande porte por meio de um método de treinamento inovador.

No processo de treinamento de modelos de linguagem de grande porte, os métodos tradicionais geralmente dependem de um único resumo de texto, o que pode levar a um sobreajuste do modelo, afetando a precisão e a diversidade do conteúdo gerado. No entanto, o novo método da Tencent introduz duas fontes de informação diferentes — um primeiro texto resumido e um segundo texto resumido. Esses textos resumidos têm quantidades diferentes de informações, e o primeiro texto resumido contém frases corretas e incorretas, formando a base do aprendizado por contraste.

Patente

Esse método de aprendizado por contraste permite que o modelo aprenda com diferentes resumos do mesmo texto. Ao distinguir entre frases corretas e incorretas no primeiro texto resumido, ele evita eficazmente os erros de aprendizado causados por um único resumo. Esse método inovador não apenas melhora a capacidade de generalização do modelo, fazendo com que ele se saia melhor com dados desconhecidos, mas também aumenta a precisão do modelo, reduzindo a probabilidade de gerar conteúdo incorreto.

Com o avanço contínuo da tecnologia de inteligência artificial, a gama de aplicações de modelos de linguagem de grande porte está se expandindo cada vez mais, mostrando um enorme potencial em áreas como processamento de linguagem natural, atendimento ao cliente inteligente e criação de conteúdo. A divulgação dessa patente da Tencent marca mais uma inovação no campo do treinamento de modelos de linguagem de grande porte, e promete fornecer novas direções para pesquisas e aplicações futuras.

É previsível que o desenvolvimento futuro dessa tecnologia impulsionará o progresso contínuo de aplicações inteligentes, ajudando diversos setores a melhorarem o uso das vantagens da inteligência artificial em suas transformações digitais.

Notícias e Informações de IA

Tencent publica nova patente para treinamento de modelos de linguagem de grande porte, melhorando a generalização e a precisão do modelo

AIbase基地