Recentemente, o Hugging Face lançou uma nova ferramenta de IA: o SmolLM. Esta é uma série de modelos de linguagem pequenos e de alto desempenho, com parâmetros variando de 135M a 1,7B, projetados especificamente para diversos dispositivos e aplicações. Imagine esses pequenos modelos rodando eficientemente em celulares e laptops – incrível!

A característica principal dos modelos SmolLM é sua combinação de tamanho compacto e grande poder. Eles oferecem excelente desempenho com menos recursos computacionais, ajudando a proteger a privacidade do usuário. O Hugging Face utilizou um conjunto de dados chamado SmolLM-Corpus para treinar esses modelos. Este conjunto de dados foi cuidadosamente selecionado e inclui uma grande quantidade de dados educacionais e sintéticos, garantindo que os modelos aprendam uma variedade de conhecimentos.

Especificamente, o SmolLM possui três versões: 135M, 360M e 1,7B parâmetros. Esses modelos não apenas processam diversas tarefas, mas também se adaptam às configurações de hardware do usuário. Por exemplo, o modelo SmolLM-135M superou muitos produtos similares, tornando-se o melhor modelo com menos de 200M de parâmetros.

image.png

Os modelos SmolLM foram avaliados em vários testes de referência, incluindo raciocínio comum e conhecimento de mundo. Esses modelos demonstraram desempenho impressionante, superando outros modelos em suas respectivas categorias de tamanho. Por exemplo, apesar de ter sido treinado em um número menor de tokens, o modelo SmolLM-135M superou o MobileLM-125M, que era o melhor modelo atual com menos de 200M de parâmetros. Da mesma forma, os modelos SmolLM-360M e SmolLM-1,7B superaram todos os outros modelos com menos de 500M e 2B de parâmetros, respectivamente.

Além do excelente desempenho, o SmolLM também recebeu um treinamento especial para melhorar sua compreensão de instruções e respostas a perguntas. O Hugging Face também oferece uma demonstração WebGPU, permitindo que você experimente diretamente as capacidades desses modelos.

O lançamento do SmolLM demonstra que mesmo modelos pequenos podem alcançar resultados surpreendentes com dados de treinamento de alta qualidade.

Acesso ao produto:https://top.aibase.com/tool/smollm

Destaques:

1. 🚀 **Desempenho eficiente**: Os modelos SmolLM oferecem excelente desempenho com poucos recursos computacionais, protegendo a privacidade do usuário.

2. 📚 **Dados abrangentes**: Utiliza o conjunto de dados SmolLM-Corpus de alta qualidade, garantindo que os modelos aprendam diversos conhecimentos.

3. 💻 **Múltiplas aplicações**: Adequado para celulares, laptops e outros dispositivos, com funcionamento flexível para atender diferentes necessidades.