DigiRL
Trainiert Agenten zur Steuerung von Geräten im Außeneinsatz mithilfe von eigenständigem verstärktem Lernen.
Normales ProduktProgrammierungVerstärktes LernenAutonomes Lernen
DigiRL ist ein innovativer Online-Algorithmus für verstärktes Lernen, der zur Schulung intelligenter Agenten entwickelt wurde, die Geräte in realen Umgebungen steuern können. Er löst offene, reale Android-Aufgaben mithilfe eines eigenständigen Bewertungsmodells (VLM). Die Hauptvorteile von DigiRL sind die Nutzung bestehender, nicht optimaler Offline-Datensätze und die Förderung des Lernens aus eigenen Fehlern durch Offline-zu-Online-Verstärkungslernen. Das Modell verwendet eine wertbasierte Funktionsweise auf Befehlsebene, um implizit automatische Lehrpläne zu erstellen, wobei Aufgaben priorisiert werden, die für den Agenten am wertvollsten sind. Eine wertbasierte Funktionsweise auf Schritt-Ebene wählt vorteilhafte Aktionen in der Trajektorie aus, die zum Ziel beitragen.