DigiRL
Entraîne des agents intelligents capables de contrôler des appareils en environnement réel à l'aide de l'apprentissage par renforcement autonome.
Produit OrdinaireProgrammationApprentissage par renforcementApprentissage autonome
DigiRL est un algorithme innovant d'apprentissage par renforcement en ligne conçu pour entraîner des agents intelligents capables de contrôler des appareils en environnement réel. Il utilise un modèle d'évaluation de valeur autonome (VLM) pour résoudre des tâches Android ouvertes et réelles. Les principaux avantages de DigiRL incluent la capacité d'exploiter les ensembles de données hors ligne existants, même non optimaux, et d'encourager l'apprentissage par renforcement hors ligne à en ligne, permettant à l'agent d'apprendre de ses erreurs. Le modèle utilise une fonction de valeur au niveau des instructions pour construire implicitement un curriculum automatique, en priorisant les tâches les plus précieuses pour l'agent, et une fonction de valeur au niveau des étapes pour sélectionner les actions bénéfiques contribuant à l'objectif dans la trajectoire.