Am 10. März stellte Zhiyuan Robotics sein erstes universelles, gekörpert-basiertes großes Sprachmodell vor – Genie Operator-1 (kurz GO-1). Diese Nachricht erregte große Aufmerksamkeit, insbesondere hinsichtlich seines Potenzials im Bereich der Haushaltsroboter, und scheint neue Hoffnung für die zukünftige Haushaltsverwaltung zu bieten. Laut der offiziellen Einführung von Zhiyuan Robotics zeigt GO-1 durch das Lernen aus einer großen Menge an menschlichen Videos hervorragende Leistungen bei der Ausführung verschiedener Haushaltsaufgaben, wie z. B. das Überreichen von Wassergläsern, das Zubereiten von Mahlzeiten und das Begrüßen von Gästen.
In Bezug auf die technische Leistung zeigt GO-1 im Vergleich zu bestehenden Modellen eine deutliche Verbesserung, mit einer durchschnittlichen Erfolgsrate, die um 32 % gestiegen ist. Tests zeigten, dass GO-1 bei bestimmten Aufgaben wie dem Eingießen von Wasser, dem Reinigen von Oberflächen und dem Auffüllen von Getränken noch bessere Ergebnisse erzielt. Zhiyuan Robotics erklärte, dass dieser Fortschritt auf die neu entwickelte Vision-Language-Latent-Action (ViLLA)-Architektur zurückzuführen ist, die es ermöglicht, hochwertige Datensätze und eine große Menge an Videodaten effektiv zu nutzen, um die Generalisierungsfähigkeit des Modells zu verbessern.
Darüber hinaus gab Zhiyuan Robotics Ende letzten Jahres zusammen mit mehreren Institutionen die Open-Source-Veröffentlichung des Millionen-Eintrag-großen realen Datensatzes AgiBot World bekannt. Dieser Datensatz umfasst über 100 reale Szenarien, darunter 40 % im Haushalt und 20 % in der Industrie. Dieser Datensatz bildet eine wichtige Grundlage für das Training und die Verbesserung der Fähigkeiten von Robotern.
Zhiyuan Robotics betont, dass das GO-1-Sprachmodell mehrere wichtige Merkmale aufweist: Erstens kann es aus menschlichen Videos lernen und so das Verständnis menschlichen Verhaltens verbessern; zweitens verfügt es über eine starke Fähigkeit zur schnellen Generalisierung mit wenigen Beispielen und kann sich mit sehr wenigen oder sogar ohne Daten an neue Aufgaben anpassen; drittens kann es zwischen verschiedenen Roboterformen übertragen werden und ermöglicht so eine flexible Anwendung mit „einem Gehirn, vielen Formen“. Durch kontinuierliche Weiterentwicklung kann GO-1 Daten aus der praktischen Ausführung sammeln und seine eigenen Fähigkeiten ständig optimieren und verbessern.
Die Veröffentlichung von Zhiyuan Robotics markiert einen wichtigen Schritt in Richtung der Verbreitung von Haushaltsrobotern mit verkörperter Intelligenz. Laut einer Analyse von Cinda Securities treiben die Fortschritte in der KI die Entwicklung von Technologien wie humanoiden Robotern und autonom fahrenden Fahrzeugen grundlegend voran, und die Zukunftsaussichten für die Industrialisierung humanoider Roboter sind vielversprechend.