OLMo-2-1124-7B-SFT est un modèle de génération de texte anglais publié par l'Allen Institute for Artificial Intelligence (AI2). Il s'agit d'une version affinée par supervision du modèle OLMo 2 7B, optimisée spécifiquement pour le jeu de données Tülu 3. Le jeu de données Tülu 3 vise à offrir des performances de pointe sur des tâches diversifiées, notamment le dialogue, la résolution de problèmes mathématiques, GSM8K, IFEval, etc. Les principaux avantages de ce modèle incluent une puissante capacité de génération de texte, la capacité de traiter des tâches diversifiées, ainsi que des codes et des détails d'entraînement open source, ce qui en fait un outil puissant pour la recherche et l'éducation.