mwp_ReFT
Framework d'ajustement fin des modèles basé sur l'apprentissage par renforcement profond
Produit OrdinaireProgrammationTraitement du langage naturelApprentissage profond
ReFT est un projet de recherche open source visant à affiner les grands modèles linguistiques à l'aide de techniques d'apprentissage par renforcement profond afin d'améliorer leurs performances sur des tâches spécifiques. Ce projet fournit du code et des données détaillés pour permettre aux chercheurs et aux développeurs de reproduire les résultats de l'article. Les principaux avantages de ReFT incluent la capacité d'ajuster automatiquement les paramètres du modèle grâce à l'apprentissage par renforcement et l'amélioration des performances du modèle sur des tâches spécifiques grâce à l'ajustement fin. ReFT est basé sur les modèles Codellama et Galactica et est publié sous licence Apache 2.0.
mwp_ReFT Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34