Tülu 3 405B est un modèle linguistique open source développé par l'Allen Institute for AI, comprenant 405 milliards de paramètres. Ce modèle a été optimisé grâce à un cadre d'apprentissage par renforcement innovant (RLVR), et excelle particulièrement dans les tâches mathématiques et de suivi d'instructions. Il est basé sur le modèle Llama-405B et utilise des techniques d'apprentissage supervisé et d'optimisation des préférences. Son caractère open source en fait un outil puissant pour la recherche et le développement, applicable à divers scénarios nécessitant un modèle linguistique haute performance.