Das Allen Institute for Artificial Intelligence (AI2) hat gemeinsam mit mehreren Universitäten OLMo, das weltweit erste vollständig quelloffene große Sprachmodell (LLM), veröffentlicht. Es umfasst Gewichte, Code, Datensätze und den gesamten Trainingsprozess. Leistungsbewertungen zeigen, dass OLMo-7B in mehreren Aufgaben leicht überlegen ist. Gleichzeitig haben die Forscher den vorab trainierten Datensatz Dolma veröffentlicht, um die offene Forschung im Bereich des Pretrainings von Sprachmodellen voranzutreiben. Im Hinblick auf die Datentransparenz werden Tools zur Datenaufbereitung und -analyse bereitgestellt.