Avanço significativo no treinamento de modelos de linguagem em miniatura pela Microsoft

站长之家

Publicado emNotícias e Informações de IA · 2 minutos de leitura · Oct 9, 2023

Pesquisadores da Microsoft apresentaram em um artigo uma nova maneira de treinar modelos de linguagem pequenos: usando histórias infantis. Em comparação com o treinamento de modelos de linguagem grandes, este método é mais rápido e seu mecanismo interno é mais fácil de entender. Estudos mostram que modelos de linguagem pequenos treinados com histórias infantis conseguem narrar histórias coerentes e gramaticalmente corretas, apresentando um desempenho excelente.

Este método ajuda a analisar o comportamento dos modelos de linguagem e também fornece uma direção de pesquisa para o treinamento de modelos maiores. Os pesquisadores afirmam que treinar modelos de linguagem pequenos é como sequenciar o genoma da mosca-da-fruta em vez do genoma humano, sendo uma maneira eficaz de explorar modelos de linguagem.

OpenAI muda para novas técnicas de treinamento: escalar modelos não é mais a chave para inovação

Com o rápido desenvolvimento da IA generativa, a crença tradicional de que 'maior é melhor' está mudando. Vários cientistas de IA de ponta afirmaram recentemente que o método de melhorar o desempenho da IA simplesmente aumentando a quantidade de dados e poder computacional está se aproximando de um gargalo, e novas direções de avanços tecnológicos estão surgindo. Ilya Sutskever, cofundador da Safe Superintelligence e OpenAI, publicou recentemente sua opinião de que os métodos tradicionais de pré-treinamento atingiram um platô de desempenho. Essa afirmação é particularmente notável, pois foi ele quem...

Notícias e Informações de IA

Avanço significativo no treinamento de modelos de linguagem em miniatura pela Microsoft

站长之家

Notícias de IA Relacionadas Recomendadas

OpenAI muda para novas técnicas de treinamento: escalar modelos não é mais a chave para inovação