DigiRL
Entrena agentes de control de dispositivos en entornos reales utilizando aprendizaje por refuerzo autónomo.
Producto ComúnProgramaciónAprendizaje por RefuerzoAprendizaje Autónomo
DigiRL es un innovador algoritmo de aprendizaje por refuerzo en línea diseñado para entrenar agentes inteligentes capaces de controlar dispositivos en entornos reales. Resuelve tareas abiertas de Android del mundo real mediante un modelo de evaluación de valor autónomo (VLM). Las principales ventajas de DigiRL incluyen la capacidad de aprovechar conjuntos de datos sin procesar no óptimos existentes y fomentar el aprendizaje autónomo del agente a través del aprendizaje por refuerzo fuera de línea a en línea. El modelo utiliza una función de valor a nivel de instrucción para construir implícitamente un plan de estudios automático, priorizando las tareas más valiosas para el agente, y una función de valor a nivel de paso para seleccionar acciones beneficiosas que contribuyan al objetivo dentro de una trayectoria.