LongVU
Modelo de compresión adaptativa espacio-temporal para la comprensión del lenguaje en videos largos
Producto ComúnVideoComprensión de vídeoCompresión espacio-temporal
LongVU es un innovador modelo de comprensión del lenguaje para videos largos que, mediante un mecanismo de compresión adaptativa espacio-temporal, reduce la cantidad de marcadores de video manteniendo los detalles visuales. La importancia de esta tecnología radica en su capacidad para procesar una gran cantidad de fotogramas de video con una pérdida mínima de información visual dentro de una longitud de contexto limitada, lo que mejora significativamente la capacidad de comprensión y análisis de contenido de videos largos. LongVU supera a los métodos existentes en varias pruebas de referencia de comprensión de video, especialmente en tareas de comprensión de videos de hasta una hora de duración. Además, LongVU se puede ampliar eficazmente a modelos de menor tamaño manteniendo un rendimiento de vanguardia en la comprensión de video.
LongVU Situación del tráfico más reciente
Total de visitas mensuales
1900
Tasa de rebote
58.75%
Páginas promedio por visita
1.3
Duración promedio de la visita
00:00:01