SMPLer-X

Ein auf großen Datenmengen und großen Sprachmodellen basierendes Modell zur Schätzung von Körperhaltung und -form

Normales ProduktProduktivitätKörperstellungsabschätzungFormabweichungserkennung
SMPLer-X ist ein auf großen Datenmengen und großen Sprachmodellen basierendes Modell zur Schätzung von Körperhaltung und -form. Es kann die Bewegungen von Körper, Händen und Gesicht einheitlich erfassen und findet breite Anwendung. Durch die systematische Untersuchung von 32 verschiedenen Datensätzen, die Optimierung des Trainingsplans und die Auswahl geeigneter Datensätze konnte die EHPS-Leistung deutlich verbessert werden. SMPLer-X nutzt Vision Transformer zur Modellskalierung und wird durch eine Feinabstimmungsstrategie in ein Expertenmodell umgewandelt, wodurch die Leistung weiter gesteigert wird. Das Modell erzielt in mehreren Benchmark-Tests hervorragende Ergebnisse, wie z. B. AGORA (107,2 mm NMVE), UBody (57,4 mm PVE), EgoBody (63,6 mm PVE) und EHF (62,3 mm PVE ohne Feinabstimmung). Der Vorteil von SMPLer-X liegt in der Fähigkeit, diverse Datenquellen zu verarbeiten, sowie in seiner hervorragenden Generalisierungsfähigkeit und Übertragbarkeit.
Website öffnen