L'Institut de recherche en innovation technologique d'Abu Dhabi (TII) a lancé Falcon 3, une nouvelle génération de modèle d'IA open source. Grâce à un entraînement sur 14 000 milliards de jetons et une architecture optimisée, il établit de nouveaux records de performance sur les matériels grand public. Cette échelle d'entraînement est plus du double de celle de son prédécesseur, Falcon 2.

La série Falcon 3 comprend quatre versions : 1B, 3B, 7B et 10B. Chaque version est disponible en version de base et en version « Instruct » optimisée pour la conversation. Bien que des versions spécifiques en anglais, français, espagnol et portugais soient proposées, tous les modèles peuvent traiter la plupart des langues courantes.

Lors de tests tiers sur Hugging Face, Falcon 3 a surpassé des modèles open source majeurs tels que Llama-3.1-8B de Meta, Qwen-2.5-7B, NeMo-12B de Mistral et Gemma2-9B de Google, démontrant ainsi une forte compétitivité.

QQ20241220-093129.png

Falcon 3 surpasse ses concurrents de taille similaire, notamment Mistral, Alibaba, Meta et Google, lors de tests de référence. | Image : Institut de recherche en innovation technologique

Le TII souligne la facilité d'utilisation du modèle, assurant sa compatibilité avec les API et les bibliothèques standard, et proposant des versions quantifiées optimisées pour des configurations matérielles spécifiques. L'institut a également lancé un chatbot gratuit pour les tests et les retours utilisateurs. Son interface s'inspire du succès de ChatGPT, intégrant des fonctionnalités similaires comme la gestion de dossiers de projets.

À l'avenir, le TII prévoit d'étendre les capacités de la série Falcon 3 début 2025 avec un modèle multimodale prenant en charge le traitement d'images, de vidéos et de la voix. Actuellement, tous les modèles sont téléchargeables gratuitement sur la plateforme Hugging Face sous licence TII Falcon basée sur Apache 2.0, incluant des lignes directrices pour une utilisation responsable de l'IA.

QQ20241220-093143.png

Falcon Chat présente une interface très similaire à celle de ChatGPT et intègre des fonctionnalités similaires. | Capture d'écran : THE DECODER

Ce lancement marque une avancée majeure dans le domaine de l'IA open source, notamment en termes d'amélioration des performances de l'IA sur les matériels grand public. Avec l'ajout de capacités multimodales, Falcon 3 devrait offrir de nouvelles possibilités d'applications innovantes à la communauté open source de l'IA en 2025.