Kürzlich hat OpenAI heimlich das Geheimnis um das „Erdbeer“-Projekt gelüftet. Dieses Projekt, zuvor als Q* bekannt, tritt nun unter dem Namen „Erdbeere“ in Erscheinung. Es soll KI ermöglichen, Aufgaben im Voraus zu planen, selbstständig im Internet nach Informationen zu suchen und sogar gründliche Recherchen durchzuführen.
Sogar der Tech-Gigant Elon Musk mischte sich ein und kommentierte scherzhaft: „Ich dachte, das Ende der KI wäre die Büroklammer-Katastrophe, aber jetzt scheint es eher ein endloses Erdbeerfeld zu werden.“
Obwohl das Erdbeer-Projekt weltweit auf großes Interesse stößt, hüllt OpenAI die Details seiner Funktionsweise in Schweigen. Die Entwicklung des Projekts ist innerhalb des Unternehmens streng geheim, sogar der Veröffentlichungstermin ist unbekannt.
Auf einer kürzlich abgehaltenen internen Konferenz präsentierte OpenAI eine Demoversion des Erdbeer-Projekts. Seine Schlussfolgerungsfähigkeit ist nahezu mit der menschlichen vergleichbar. Dies stimmt mit ihrer kürzlich veröffentlichten AGI-Roadmap überein und lässt vermuten, dass OpenAI größere Pläne schmiedet.
Das Erdbeer-Modell zielt darauf ab, dass die KI nicht nur Antworten auf Anfragen generieren kann, sondern auch im Voraus planen und selbstständig und zuverlässig im Internet surfen kann, um sogenannte „gründliche Recherchen“ durchzuführen. Eine solche Fähigkeit ist im KI-Bereich bisher einzigartig.
Einem Insider zufolge ähnelt das Erdbeer-Projekt von OpenAI einer von der Stanford University entwickelten Methode – dem „Selbstlernenden Schlussfolgerer“ (kurz STaR). STaR verbessert sich selbst durch iteratives Erstellen von Trainingsdaten.
论文地址:https://arxiv.org/pdf/2203.14465
Derzeit sind Methoden zur Generierung von Schlussfolgerungsprozessen durch KI entweder sehr teuer oder beeinträchtigen die Genauigkeit. Die STaR-Technologie hingegen verbessert die KI durch iterative Verwendung weniger Beispiele mit Schlussfolgerungen und vieler Daten ohne Schlussfolgerungen.
Der Arbeitsablauf der STaR-Technologie sieht folgendermaßen aus: Zuerst versucht die KI, viele Fragen zu beantworten und generiert dabei den Schlussfolgerungsprozess. Wenn die Antwort falsch ist, wird der Schlussfolgerungsprozess unter Kenntnis der richtigen Antwort neu generiert. Anschließend werden alle Schlussfolgerungen, die letztendlich zur richtigen Antwort führen, feinabgestimmt, und der Prozess wird wiederholt.
OpenAI hofft, dass die Innovation von Erdbeere die Schlussfolgerungsfähigkeit von KI-Modellen deutlich verbessern wird. Dies beinhaltet eine spezielle Behandlungsmethode: Nach dem Vortraining des KI-Modells mit einer großen Datenmenge wird es angepasst, um die Leistung zu optimieren.
OpenAI hofft außerdem, dass Erdbeere langwierige Aufgaben (LHT) ausführen kann. Dies erfordert, dass das Modell im Voraus plant und eine Reihe von Aktionen ausführt. Um dieses Ziel zu erreichen, werden derzeit „gründliche Recherche“-Datensätze erstellt und bewertet.
Mit dem Fortschritt des Erdbeer-Projekts kommt OpenAI dem Ziel der AGI immer näher. Wenn die Schlussfolgerungsfähigkeit von Erdbeere tatsächlich mit der menschlichen vergleichbar ist, wird die Zukunft der KI grenzenlos sein.