A Meta lançou o modelo Llama2-Long, que processa textos longos sem aumentar a demanda computacional, mantendo um desempenho excepcional. Utilizando pré-treinamento contínuo, melhorias no código de posição e uma estratégia de mistura de dados, a redução nos custos computacionais pode chegar a 40%. Ele demonstra desempenho superior em tarefas curtas e longas, superando até mesmo o GPT-3.5. Este lançamento injeta nova vitalidade no campo do processamento de linguagem natural.
Meta lança o modelo Llama 2-Long, reduzindo em 40% a demanda computacional para processamento de textos longos

站长之家
59
© Todos os direitos reservados AIbase Base 2024, clique para ver a fonte - https://www.aibase.com/pt/news/1979