Dolma: Ein offener Textdatensatz für AI-Sprachmodelle

Das Allen Institute for Artificial Intelligence (AI2) hat einen offenen Textdatensatz namens Dolma veröffentlicht, um Transparenz und Innovation bei KI-Sprachmodellen zu fördern. Dolma bildet den Kern des AI2 Open Language Model (OLMo) Programms und bietet Forschern und Entwicklern kostenlose Datenressourcen zur Unterstützung einer breiteren KI-Forschung.

Dolma ist nicht nur ein umfangreicher offener Datensatz mit 3 Milliarden Token, sondern zeichnet sich auch durch seine einfache Nutzung und Lizenzierung aus. AI2 verwendet die „ImpACT-Lizenz für mittelriskante Ergebnisse“ und ermutigt Benutzer, Kontaktinformationen und Nutzungsdaten bereitzustellen. Die Veröffentlichung dieses Datensatzes bietet Forschern und Entwicklern mehr Ressourcen und fördert eine transparentere und kooperativere Zukunft im Bereich der KI.