La serie ShareGPT4Video tiene como objetivo facilitar la comprensión de video en modelos de lenguaje-video de gran tamaño (LVLMs) y la generación de video en modelos de texto-a-video (T2VMs) mediante subtítulos densos y precisos. Esta serie incluye: 1) ShareGPT4Video, subtítulos de video densos con 40.000 anotaciones GPT4V, desarrollados mediante estrategias de filtrado y anotación de datos cuidadosamente diseñadas. 2) ShareCaptioner-Video, un modelo de subtitulado de video eficiente y potente para cualquier video, con 4,8 millones de videos estéticos de alta calidad anotados. 3) ShareGPT4Video-8B, un LVLM simple pero excelente que ha alcanzado el mejor rendimiento en tres pruebas de referencia de video avanzadas.