Das Team von Verses hat mit seinem entwickelten Genius-Agenten bemerkenswerte Erfolge im klassischen Spiel Pong erzielt. Mit nur 10% der Datenmenge und einer Trainingszeit von 2 Stunden übertraf er sowohl Spitzensportler als auch andere KI-Modelle. Dieser Durchbruch markiert einen neuen Meilenstein in der KI-Technologie und deutet auf zukünftige Entwicklungen im Bereich der intelligenten Agenten hin.
Der Erfolg des Genius-Agenten basiert auf seinem einzigartigen Design. Im Vergleich zu traditionellen, großen Modellen ist Genius nur 4% so groß wie das SOTA-Modell IRIS und kann auf einem gewöhnlichen MacBook mit M1-Chip betrieben werden. Die Inspiration der Forscher stammt von einem vier Jahre alten Experiment, bei dem Wissenschaftler feststellten, dass ein kultiviertes „Gehirn im Labor“ Pong in nur 5 Minuten erlernen konnte. Dies regte sie dazu an, die Funktionsweise des menschlichen Gehirns nachzuahmen.
Bildquelle: Das Bild wurde mit KI generiert, Bildrechte liegen bei Midjourney.
Das Verses-Team ist der Ansicht, dass traditionelle, auf großen Modellen basierende KI-Agenten gravierende Mängel in der logischen Schlussfolgerung aufweisen. Bestehende Modelle verlassen sich eher darauf, die in den Trainingsdaten gespeicherten Schlussfolgerungsschritte nachzuvollziehen, und mangelt es ihnen an echter Eigeninitiative und Neugier. Der Genius-Agent verwendet das Konzept einer kognitiven Engine, die nicht nur kognitive, Schlussfolgerungs- und Entscheidungsfähigkeiten besitzt, sondern dem Agenten auch die Fähigkeit zum selbstständigen Lernen verleiht.
In Vergleichstests mit IRIS und anderen KI-Modellen zeigte Genius eine beeindruckende Lernfähigkeit. Die Forscher trainierten Genius innerhalb von 2 Stunden mit 10.000 Spielschritten. Die Ergebnisse zeigten eine bessere Leistung als bei IRIS nach zweitägigem Training. Der Erfolg von Genius liegt nicht nur in seiner schnellen Lernfähigkeit, sondern auch in seinem proaktiven Verhalten im Spiel. Beispielsweise konnte Genius in Pong-Spielen auch bei Rückstand noch Siege erringen – ein Phänomen, das bei IRIS nicht beobachtet wurde.
Die Forscher weisen jedoch darauf hin, dass es, obwohl die Leistung von Genius beeindruckend ist, derzeit noch an einem einheitlichen Standard zur umfassenden Bewertung der AGI-Leistung mangelt. Vielfältige Tests sind erforderlich, um seine Anpassungsfähigkeit und Zuverlässigkeit in verschiedenen Bereichen zu überprüfen.
Dieses Forschungsergebnis fördert nicht nur die Entwicklung von KI-Agenten, sondern bietet auch neue Ansätze und Methoden für die zukünftige Erforschung der künstlichen Intelligenz.
论文地址:https://arxiv.org/pdf/2410.05229