Stable Virtual Camera es un modelo de difusión general de 1.3B parámetros desarrollado por Stability AI, perteneciente a los modelos de imagen a vídeo Transformer. Su importancia radica en que proporciona soporte técnico para la síntesis de nuevas vistas (NVS), pudiendo generar nuevas vistas de escenas 3D consistentes a partir de vistas de entrada y una cámara objetivo. Las principales ventajas son la posibilidad de especificar libremente la trayectoria de la cámara objetivo, la capacidad de generar muestras con grandes cambios de perspectiva y suaves en el tiempo, el mantenimiento de una alta consistencia sin necesidad de destilación adicional de campos de radiación neural (NeRF), y la capacidad de generar vídeos de alta calidad sin cortes de hasta medio minuto de duración. El modelo solo puede utilizarse gratuitamente para fines de investigación y no comerciales, y está destinado a proporcionar a los investigadores y creadores no comerciales soluciones innovadoras de imagen a vídeo.