Das Allen Institute for Artificial Intelligence (AI2) hat gemeinsam mit mehreren Universitäten OLMo, das weltweit erste vollständig quelloffene große Sprachmodell (LLM), veröffentlicht. Es umfasst Gewichte, Code, Datensätze und den gesamten Trainingsprozess. Leistungsbewertungen zeigen, dass OLMo-7B in mehreren Aufgaben leicht überlegen ist. Gleichzeitig haben die Forscher den vorab trainierten Datensatz Dolma veröffentlicht, um die offene Forschung im Bereich des Pretrainings von Sprachmodellen voranzutreiben. Im Hinblick auf die Datentransparenz werden Tools zur Datenaufbereitung und -analyse bereitgestellt.
Allen Institute for AI veröffentlicht weltweit erstes vollständig Open-Source-Sprachmodell

站长之家
Dieser Artikel stammt aus dem AIbase-Tagesbericht
Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.