In den letzten Jahren haben große Sprachmodelle wie ChatGPT eine neue Welle im Bereich der KI ausgelöst. Diese leistungsstarken Sprachmodelle können nicht nur menschliche Anweisungen verstehen, sondern auch Pläne erstellen, Umgebungen erkunden und Werkzeuge nutzen, um komplexe Aufgaben zu lösen. Sie zeigen ein enormes Potenzial in Bereichen wie Robotik, persönliche Assistenten und Prozessautomatisierung.
Die meisten bestehenden KI-Agentensysteme sind jedoch passiv und benötigen eindeutige menschliche Anweisungen, um Aufgaben auszuführen. Ein Meeting zu organisieren bedeutet, Zeit, Ort und sogar alle Teilnehmer manuell einzugeben – umständlicher als es selbst zu tun!
Stellen Sie sich vor: Sie erhalten eine E-Mail von einem Kollegen mit dem Vorschlag, ein Meeting abzuhalten. Ein passiver KI-Agent würde auf Ihre eindeutige Anweisung warten, um das Meeting zu organisieren. Ein proaktiver KI-Agent hingegen würde diese E-Mail bemerken und sich aktiv anbieten, das Meeting zu planen. Diese Proaktivität reduziert nicht nur die kognitive Belastung des Benutzers, sondern erkennt auch unausgesprochene, potenzielle Bedürfnisse.
Um das Problem der Passivität von KI-Assistenten zu lösen, haben die Tsinghua-Universität und die Firma „Mianbi Intelligence“ zusammengearbeitet und einen völlig neuen KI-Agenten entwickelt. Dieser ist keine „gehorsame Maschine“ mehr, sondern kann „vorausschauend“ handeln und Dinge erledigen, bevor Sie überhaupt etwas sagen!
Wie funktioniert dieser „magische“ KI-Agent? Das Geheimnis liegt im ProactiveBench-Datensatz! Dieser Datensatz ist wie eine „Enzyklopädie“ menschlicher Aktivitäten. Er enthält jeden Buchstaben, den Sie am Computer getippt haben, jeden angeklickten Link und sogar alles, was Sie kopiert und eingefügt haben!
Mit diesem Datensatz trainierten die Forscher ein Belohnungsmodell. Es ist wie ein „simulierter menschlicher Verstand“, ein Supercomputer, der beurteilen kann, ob das Verhalten des KI-Agenten den menschlichen Erwartungen entspricht. Bei guter Leistung erhält der KI-Agent eine Belohnung, bei schlechter Leistung wird er bestraft. Durch wiederholtes Training kann der KI-Agent wie ein Mensch aus Ihrem Verhalten Ihre Bedürfnisse vorhersagen und Ihnen bei Bedarf proaktiv helfen.
Ein Beispiel: Sie erhalten eine E-Mail von einem Kollegen mit dem Vorschlag, ein Meeting abzuhalten. Der „vorausschauende“ KI-Agent erkennt den Inhalt der E-Mail und fragt Sie proaktiv, ob Sie ein Meeting planen möchten. Wenn Sie zustimmen, plant er automatisch Zeit, Ort und sendet sogar die Meeting-Einladung! Ist das nicht viel „klüger“ als heutige KI-Assistenten?
Die Ergebnisse zeigen, dass der mit dem ProactiveBench-Datensatz trainierte KI-Agent hervorragende Leistungen erbringt. Beispielsweise erreicht das Qwen2-7B-Instruct-Modell einen F1-Score von 66,47 % bei der proaktiven Hilfeleistung und übertrifft damit alle Open-Source- und Closed-Source-Modelle!
Obwohl sich dieser „vorausschauende“ KI-Agent noch in der Forschungsphase befindet, bietet er neue Hoffnung für die zukünftige Mensch-Maschine-Zusammenarbeit. Wir können davon ausgehen, dass wir in naher Zukunft einen KI-Assistenten haben werden, der uns wirklich „versteht“, nicht nur „gehorcht“, sondern uns auch proaktiv bei der Lösung verschiedener Probleme unterstützt und unser Leben einfacher und bequemer macht!
论文地址:https://arxiv.org/pdf/2410.12361