Meta Lança o Modelo Llama2-Long

A Meta lançou o modelo Llama2-Long, que processa textos longos sem aumentar a demanda computacional, mantendo um desempenho excepcional. Utilizando pré-treinamento contínuo, melhorias no código de posição e uma estratégia de mistura de dados, a redução nos custos computacionais pode chegar a 40%. Ele demonstra desempenho superior em tarefas curtas e longas, superando até mesmo o GPT-3.5. Este lançamento injeta nova vitalidade no campo do processamento de linguagem natural.