Ein chinesisches Forschungsteam hat in Zusammenarbeit den innovativen, multiperspektivischen Datensatz „FreeMan“ entwickelt, um die Einschränkungen bestehender 3D-Körperstellungs-Datensätze zu beheben. Dieser Datensatz umfasst 11 Millionen Videobilder von 8 Smartphones, aufgenommen in Innen- und Außenbereichen unter verschiedenen Lichtbedingungen. Er bietet somit eine reichhaltige Ressource für die Diversität realer Szenarien.
Mithilfe eines automatisierten Annotationsprozesses erstellten die Forscher präzise 3D-Annotationen, die für verschiedene Aufgaben verwendet werden können, darunter die 2D-zu-3D-Konvertierung, die multiperspektivische 3D-Schätzung und das neuronale Rendering.
Die Open-Source-Veröffentlichung des FreeMan-Datensatzes wird die Entwicklung von Datensätzen für das groß angelegte Vortraining fördern und gleichzeitig einen neuen Benchmark für die 3D-Körperstellungs-Schätzung im Freien liefern. Diese Innovation dürfte Fortschritte in den Bereichen Körpermodellierung, Computer Vision und Mensch-Computer-Interaktion vorantreiben und die Lücke zwischen kontrollierten Laborbedingungen und realen Szenarien schließen.