SA-V Dataset es un conjunto de datos de vídeo de mundo abierto diseñado para entrenar modelos de segmentación de objetivos generales. Contiene 51 000 vídeos diversos y 643 000 máscaras de segmentación espacio-temporales (masklets). Este conjunto de datos se utiliza para la investigación en visión por computadora y está disponible bajo la licencia CC BY 4.0. El contenido de los vídeos es diverso, abarcando temas como ubicaciones, objetos y escenas. Las máscaras varían desde objetos a gran escala, como edificios, hasta detalles como la decoración interior.