OLMo 2, Ai2 द्वारा प्रस्तुत नवीनतम सर्व-ओपन लैंग्वेज मॉडल है, जिसमें 7B और 13B के दो आकार के मॉडल शामिल हैं, जिन्हें 5T टोकन के विशाल डेटासेट पर प्रशिक्षित किया गया है। ये मॉडल प्रदर्शन में समान आकार के अन्य सर्व-ओपन मॉडल के बराबर या उससे बेहतर हैं, और अंग्रेजी अकादमिक बेंचमार्क में Llama 3.1 जैसे ओपन-वेट मॉडल के साथ प्रतिस्पर्धा करते हैं। OLMo 2 के विकास में मॉडल प्रशिक्षण की स्थिरता, चरणबद्ध प्रशिक्षण हस्तक्षेप, अत्याधुनिक पोस्ट-ट्रेनिंग विधियाँ और एक कार्यात्मक मूल्यांकन ढांचा पर ध्यान केंद्रित किया गया है। इन तकनीकों के उपयोग ने OLMo 2 को कई कार्यों में उत्कृष्ट प्रदर्शन करने में सक्षम बनाया है, खासकर ज्ञान स्मरण, सामान्य ज्ञान, सामान्य और गणितीय तर्क में।