RLVR-GSM-MATH-IF-Mixed-Constraints
Jeu de données de problèmes mathématiques pour la validation de l'apprentissage par renforcement
Produit OrdinaireAutreMathématiquesÉducation
Le jeu de données RLVR-GSM-MATH-IF-Mixed-Constraints est un ensemble de données axé sur les problèmes mathématiques. Il contient divers types de problèmes mathématiques et leurs solutions correspondantes, destinés à l'entraînement et à la validation de modèles d'apprentissage par renforcement. Son importance réside dans sa capacité à contribuer au développement d'outils d'aide à l'éducation plus intelligents, améliorant ainsi les capacités des élèves à résoudre des problèmes mathématiques. Publié par allenai sur la plateforme Hugging Face, il inclut les sous-ensembles GSM8k et MATH, ainsi que des invites IF avec contraintes vérifiables. Il est disponible sous licence MIT et ODC-BY.
RLVR-GSM-MATH-IF-Mixed-Constraints Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44