Le jeu de données Dolma

L'Allen Institute for Artificial Intelligence (AI2) a publié un jeu de données textuelles ouvert appelé Dolma, visant à promouvoir la transparence et l'innovation dans les modèles linguistiques de l'IA. Au cœur du programme de modèles linguistiques ouverts (OLMo) d'AI2, Dolma offrira aux chercheurs et développeurs une ressource de données gratuite pour soutenir une recherche en IA plus large.

Dolma n'est pas seulement un vaste jeu de données ouvert, avec 3 milliards de jetons, mais il est également facile à utiliser et à autoriser. AI2 a adopté la licence ImpACT pour les résultats à risque modéré, et encourage les utilisateurs à fournir des informations de contact et des données d'utilisation. La mise à disposition de ce jeu de données offre aux chercheurs et développeurs des ressources supplémentaires, ce qui contribuera à un avenir plus transparent et collaboratif dans le domaine de l'IA.