Kürzlich haben die Galaxy General Technology Company, das Beijing Zhiyuan Artificial Intelligence Research Institute, die Peking University und die Hong Kong University gemeinsam das Ende-zu-Ende-Grundmodell für körperliches Greifen namens GraspVLA vorgestellt. Die Einführung dieses Modells markiert einen bedeutenden Durchbruch in der Technologie der körperlichen Intelligenz und verfügt über umfassende Fähigkeiten in Bezug auf Wahrnehmung, Lernen und Umweltinteraktion.
Der Trainingsprozess von GraspVLA umfasst zwei Phasen: die Vor- und die Nachschulung. Die Vorabtrainierung basiert auf einer Milliarde Frames an Daten und stellt die hohe Generalisierbarkeit und die Fähigkeit zu Null-Shot-Tests des Modells in verschiedenen Szenarien sicher. Dies bedeutet, dass das Modell auch in unbekannten Umgebungen und bei unbekannten Aufgaben eine hervorragende Greifleistung zeigt. Diese Leistungsverbesserung deutet darauf hin, dass die Flexibilität und Anpassungsfähigkeit intelligenter Roboter in der Praxis deutlich verbessert werden.
Bildquelle: Das Bild wurde von KI generiert, Bildrechte liegen bei Midjourney.
Das Unternehmen veröffentlichte auch sieben allgemeine „Goldstandards“, die der Branche neue Bewertungskriterien liefern. Diese Standards bieten Entwicklern nicht nur klare Ziele, sondern geben auch Forschern Orientierung bei der Modelloptimierung und der praktischen Anwendung. Galaxy General erklärte, dass GraspVLA eine starke Unterstützung für die autonome Bedienung von Robotern, die Objekterkennung und die Interaktion in komplexen Umgebungen bieten wird.
Mit dem kontinuierlichen Fortschritt der künstlichen Intelligenz sind die Anwendungsaussichten der körperlichen Greiftechnologie weitreichend. GraspVLA, als Vorreiter auf diesem Gebiet, wird in verschiedenen Branchen wie Lagerlogistik, Fertigung und Gesundheitswesen eine wichtige Rolle spielen. Zukünftig werden Roboter nicht mehr auf einfache, repetitive Arbeiten beschränkt sein, sondern in der Lage sein, verschiedene Umgebungen zu lernen und sich an diese anzupassen, komplexere Aufgaben zu erledigen und sogar eine natürlichere Interaktion mit Menschen zu führen.
Auf der Pressekonferenz gaben die beteiligten Institutionen an, dass sie sich auch in Zukunft für die Förderung dieses Bereichs und die Erforschung weiterer praktischer Anwendungsszenarien einsetzen werden. Die Veröffentlichung von GraspVLA markiert einen wichtigen Schritt für intelligente Roboter in Richtung eines neuen Zeitalters des „verständigen Greifens“.