Das norwegische Startup 1X Technologies hat kürzlich bedeutende Fortschritte bei der Entwicklung von KI-basierten Weltmodellen für Roboter angekündigt. Vereinfacht gesagt, sind diese Modelle wie virtuelle Testumgebungen für Roboter, die es ihnen ermöglichen, in verschiedenen Szenarien getestet und verbessert zu werden, ganz ohne reale Tests.
1X ist der Ansicht, dass dies der Schlüssel zur Lösung des „Roboterproblems“ ist – also der zuverlässigen Bewertung von Robotern, die für verschiedene Aufgaben trainiert wurden und in sich verändernden Umgebungen eingesetzt werden. Ein Beispiel: Ein Roboter, der T-Shirts falten kann, zeigt über 50 Tage hinweg inkonsistente Leistungen, wobei Erfolge oft nur von kurzer Dauer sind.
1X erklärt, dass selbst bei gleichen Robotermodellen erhebliche Leistungsschwankungen bei sich ändernden Umgebungsbedingungen auftreten, was eine strenge reale Bewertung extrem schwierig macht.
Um ihre Weltmodelle zu trainieren, hat 1X Tausende von Stunden Videomaterial gesammelt, das ihren humanoiden Roboter EVE bei der Ausführung verschiedener Aufgaben in Haushalten und Büros zeigt. Durch maschinelles Lernen kann das Modell nun die Reaktion von Objekten und Umgebungen auf die Aktionen des Roboters vernünftig vorhersagen. Selbst für nicht explizit programmierte Verhaltensweisen generiert das Modell glaubwürdige visuelle Ausgaben, z. B. das Erlernen, den Kontakt mit Menschen und Objekten zu vermeiden.
Derzeit kann das Modell von 1X einige komplexe physikalische Interaktionen verarbeiten, wie das Greifen und Heben von Objekten, das Öffnen von Türen und Schubladen sowie die Handhabung von verformbaren Materialien wie Kleidung, einschließlich des Faltens von T-Shirts.
Der Kernwert ihrer Weltmodelle liegt in der Simulation von Objektinteraktionen. Beispielsweise erhält das Modell in den nächsten Generationen das gleiche Anfangsbild und drei verschiedene Aktionssätze zum Greifen eines Kastens. In jedem Fall wird der gegriffene Kasten mit der Bewegung des Roboterarms angehoben und bewegt, während die anderen Kisten an Ort und Stelle bleiben.
Trotzdem räumt 1X einige Einschränkungen ein. Beispielsweise fällt es dem Modell manchmal schwer, die Farbe und Form von Objekten konsistent zu halten oder physikalische Phänomene genau zu simulieren. Die Fähigkeit zur Selbsterkennung im Spiegel ist ebenfalls noch nicht zuverlässig.
Trotz der Herausforderungen betrachtet 1X diese Weltmodelle als Meilenstein bei der Entwicklung und dem Training universeller Roboter. Um den Fortschritt zu beschleunigen, stellt das Unternehmen über den „1X Weltmodell-Wettbewerb“ Datensätze, vortrainierte Modelle und Preisgelder zur Verfügung.
Das langfristige Ziel von 1X ist es, Weltmodelle direkt zum Robotertraining zu nutzen, was im Vergleich zu realen Tests eine enorme Effizienzsteigerung bringen würde. Um dieses Ziel zu erreichen, rekrutiert das Unternehmen aktiv Experten im Bereich der künstlichen Intelligenz. Anfang des Jahres hat 1X außerdem erfolgreich 100 Millionen US-Dollar an Finanzmitteln eingeworben, um die Markteinführung seines humanoiden Haushaltsroboters Neo voranzutreiben. Diese Finanzierung wurde von Branchenführern wie OpenAI unterstützt, was die hohen Erwartungen an die Technologie von 1X deutlich zeigt.
Neben 1X investiert auch Nvidia stark in humanoide Roboter. Das Unternehmen hat kürzlich eine Trainingsmethode unter Verwendung von Apples Vision Pro vorgestellt. Nvidia-Forscher Jim Fan ist der Ansicht, dass die Robotik in den nächsten Jahren einen „GPT-3-Moment“ erleben wird.