O Instituto de Inovação Tecnológica de Abu Dhabi (TII) lançou o Falcon3, sua nova geração de modelos de IA de código aberto. Com treinamento em 14 trilhões de tokens e um design de arquitetura otimizado, ele estabelece um novo recorde de desempenho em hardware de consumo. Este volume de treinamento é mais do que o dobro do seu antecessor, o Falcon2.

A série Falcon3 oferece quatro variantes: 1B, 3B, 7B e 10B, cada uma disponível em uma versão básica e uma versão Instruct otimizada para diálogo. Embora existam versões específicas para inglês, francês, espanhol e português, todos os modelos conseguem processar a maioria das línguas comuns.

Em avaliações de modelos de linguagem de terceiros no Hugging Face, o Falcon3 superou modelos de código aberto populares como o Llama-3.1-8B (Meta), Qwen2.5-7B, NeMo-12B (Mistral) e Gemma2-9B (Google), demonstrando sua forte competitividade.

QQ20241220-093129.png

O Falcon3 superou concorrentes de tamanho semelhante da Mistral, Alibaba, Meta e Google em testes de referência relevantes. | Imagem: Instituto de Inovação Tecnológica

O TII destaca a facilidade de uso do modelo, garantindo compatibilidade com APIs e bibliotecas padrão, e oferecendo versões quantizadas otimizadas para recursos específicos de hardware. Além disso, o instituto lançou um chatbot gratuito para testes e feedback do usuário. O design da interface se inspira no sucesso do ChatGPT, incluindo recursos como pastas de projetos.

O TII planeja expandir as capacidades da série Falcon3 no início de 2025, lançando um modelo multimodal que suporte processamento de imagens, vídeos e voz. Atualmente, todos os modelos estão disponíveis para download gratuito na plataforma Hugging Face, sob a licença TII Falcon baseada em Apache 2.0, que inclui diretrizes para o uso responsável da IA.

QQ20241220-093143.png

O Falcon Chat tem uma interface muito semelhante à do ChatGPT e inclui recursos semelhantes. | Imagem: captura de tela do THE DECODER

Este lançamento marca mais um avanço importante no campo da IA de código aberto, especialmente em relação ao aumento do desempenho da IA em hardware de consumo. Com a adição de capacidades multimodais, o Falcon3 promete trazer mais possibilidades de aplicações inovadoras para a comunidade de código aberto de IA em 2025.