Der SA-V Datensatz ist ein Open-World-Videodatensatz, der speziell für das Training von Modellen zur universellen Objekterkennung entwickelt wurde. Er enthält 51.000 diverse Videos und 643.000 spatio-temporale Segmentierungsmasken (Masklets). Dieser Datensatz dient der Forschung im Bereich Computer Vision und steht unter der CC BY 4.0 Lizenz zur Verfügung. Die Videoinhalte sind vielfältig und umfassen Themen wie Orte, Objekte und Szenen. Die Masken reichen von großflächigen Objekten wie Gebäuden bis hin zu Details wie Inneneinrichtung.