Nach aktuellen Berichten hat die Firma Emergence AI einen neuen intelligenten Webagenten namens Agent-E vorgestellt, der eine Erfolgsrate von 73,2 % erreicht und damit eine Verbesserung von 20 % gegenüber früheren Versionen aufweist. Diese neue Technologie zielt darauf ab, die autonome Webnavigation zu ermöglichen, sodass KI-Agenten komplexe Online-Aufgaben effizienter erledigen können – von der Datenrecherche und Formularübermittlung bis hin zur Buchung der günstigsten Flugtickets oder Unterkünfte.

image.png

Traditionelle Webagenten sind bei der Bewältigung der Komplexität und Dynamik moderner Webseiten oft ineffizient und fehleranfällig. Sie können Aufgaben häufig nicht korrekt ausführen, da sie mit den komplexen und umfangreichen HTML-Dokumentenobjektmodellen (DOMs) nicht effektiv umgehen können. Diese Ineffizienz stellt ein wichtiges Hindernis für den praktischen Einsatz autonomer Webagenten dar, wo Zuverlässigkeit und Genauigkeit entscheidend sind.

Das Forschungsteam von Emergence AI hat Agent-E vorgestellt, einen neuen Webagenten, der die Mängel bestehender Systeme beheben soll. Agent-E verwendet eine hierarchische Architektur, die die Phasen der Aufgabenplanung und -ausführung in zwei unabhängige Komponenten unterteilt: einen Planungsagenten und einen Browser-Navigationsagenten. Diese Spezialisierung jeder Komponente auf ihre jeweilige Aufgabe erhöht die Effizienz und Leistung. Der Planungsagent zerlegt Benutzeraufgaben in kleinere Unteraufgaben, die dann vom Browser-Navigationsagenten mithilfe fortschrittlicher DOM-Raffinierungstechniken ausgeführt werden.

image.png

Die Methode von Agent-E umfasst mehrere innovative Schritte zur effektiven Verwaltung umfangreicher und komplexer Webinhalte. Der Planungsagent zerlegt Benutzeraufgaben in kleinere Unteraufgaben und weist sie dem Browser-Navigationsagenten zu. Dieser verwendet flexible DOM-Raffinierungstechniken, um für jede Aufgabe die relevantesten DOM-Darstellungen auszuwählen, reduziert so den „Rauschen“ und konzentriert sich auf die spezifischen Aufgabeninformationen. Agent-E verwendet Änderungsbeobachtung, um Zustandsänderungen während der Aufgabenabwicklung zu überwachen und Feedback zur Verbesserung der Leistung und Genauigkeit des Agenten zu liefern.

Bei der Bewertung mit dem WebVoyager-Benchmark übertraf Agent-E deutlich die bisher fortschrittlichsten Webagentensysteme. Agent-E erreichte eine Erfolgsrate von 73,2 %, was eine Verbesserung von 20 % gegenüber herkömmlichen Text-basierten Webagenten und von 16 % gegenüber multimodalen Webagenten darstellt. Auf komplexen Webseiten wie Wolfram Alpha verbesserte sich die Leistung von Agent-E um 30 %. Neben der Erfolgsrate berichtete das Forschungsteam auch über weitere Kennzahlen wie die Aufgabenbearbeitungszeit und die Fehlererkennung. Agent-E benötigt durchschnittlich 150 Sekunden, um eine Aufgabe erfolgreich zu erledigen, bei fehlgeschlagenen Aufgaben sind es 220 Sekunden. Jede Aufgabe benötigt durchschnittlich 25 Aufrufe eines Large Language Models, was die Effizienz und Wirksamkeit unterstreicht.

Die von Emergence AI durchgeführte Forschung stellt einen bedeutenden Fortschritt im Bereich der autonomen Webnavigation dar. Durch die Verwendung einer hierarchischen Architektur und fortschrittlicher DOM-Management-Techniken wurden die Ineffizienzen bestehender Webagentensysteme behoben. Agent-E setzt neue Maßstäbe in Bezug auf Leistung und Zuverlässigkeit. Die Ergebnisse zeigen, dass diese Innovationen auch auf andere KI-gesteuerte Automatisierungsbereiche ausserhalb der Webautomatisierung angewendet werden können und wertvolle Einblicke in die Designprinzipien von Agentensystemen liefern. Der Erfolg von Agent-E bei der Erreichung einer 73,2%igen Aufgabenabschlussrate und der effizienten Aufgabenabwicklung unterstreicht sein Potenzial, die Webnavigation und -automatisierung zu revolutionieren.

Projektseite:https://top.aibase.com/tool/agent-e

### Wichtigste Punkte:

🌟 Emergence AI präsentiert Agent-E: 73,2 % Erfolgsrate, 20 % Verbesserung

🌟 Agent-E verwendet eine hierarchische Architektur und DOM-Management-Techniken

🌟 Deutlich besser als bisherige Systeme im WebVoyager-Benchmark