A Meta Platforms lançou hoje novas versões reduzidas do seu modelo Llama, incluindo o Llama 3.21B e o 3B. Pela primeira vez, modelos de linguagem de grande escala funcionam de forma estável em smartphones e tablets comuns. Através da integração inovadora de técnicas de treinamento quantizado e algoritmos otimizados, as novas versões reduzem o tamanho do arquivo em 56%, a necessidade de memória em 41% e aumentam a velocidade de processamento em 4 vezes em comparação com a versão original, processando até 8.000 caracteres de texto continuamente por vez, mantendo a qualidade de processamento.

QQ20241025-112931.png

Em testes em telefones Android, os modelos de IA compactados da Meta (SpinQuant e QLoRA) mostraram melhorias significativas na velocidade e eficiência em comparação com as versões padrão. Os modelos menores tiveram um aumento de quatro vezes na velocidade, com redução no consumo de memória.

Em testes reais em um OnePlus 12, a versão compactada apresentou desempenho semelhante à versão padrão, mas com uma eficiência muito maior, resolvendo efetivamente o problema de longa data da capacidade de processamento insuficiente em dispositivos móveis. A Meta adotou uma estratégia de mercado de colaboração aberta, trabalhando em estreita colaboração com fabricantes de processadores móveis líderes, como Qualcomm e MediaTek. As novas versões serão lançadas simultaneamente no site oficial do Llama e na plataforma Hugging Face, oferecendo aos desenvolvedores um acesso conveniente.

Essa estratégia contrasta fortemente com a de outros gigantes do setor. Enquanto o Google e a Apple optam por integrar novas tecnologias profundamente em seus sistemas operacionais, a abordagem aberta da Meta oferece aos desenvolvedores maior espaço para inovação. Este lançamento marca uma mudança nos padrões de processamento de dados, de servidores centralizados para dispositivos pessoais. Soluções de processamento local não apenas protegem melhor a privacidade do usuário, mas também oferecem uma experiência mais rápida.

Esta inovação tecnológica pode desencadear uma mudança significativa, semelhante à popularização dos computadores pessoais, embora ainda existam desafios relacionados aos requisitos de desempenho dos dispositivos e à escolha da plataforma de desenvolvimento. Com a melhoria contínua do desempenho dos dispositivos móveis, as vantagens das soluções de processamento local se tornarão cada vez mais evidentes. A Meta espera, por meio da colaboração aberta, impulsionar o setor para uma direção mais eficiente e segura, abrindo novas possibilidades para o desenvolvimento de aplicativos em dispositivos móveis.