es
Ranking de Productos de IA
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
Inicio
Noticias de IA
AI Diario
Guías de Monetización
Tutoriales de IA
Navegación de Herramientas de IA
Biblioteca de Productos de IA
es
Ranking de Productos de IA
Busca la dinámica global de productos de IA
Busca información global de IA y descubre nuevas oportunidades de IA
Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA
Tipo :
Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA
2024-10-29 11:18:23
.
AIbase
.
12.8k
¡Rompe el molde en la comprensión de video! Video-XL, el modelo que procesa videos de hasta una hora.
Actualmente, los modelos de lenguaje grandes multimodales (MLLM) han logrado avances significativos en el campo de la comprensión de video, pero el procesamiento de videos extra largos sigue siendo un desafío. Esto se debe a que los MLLM suelen tener dificultades para procesar miles de tokens visuales que superan la longitud máxima del contexto y se ven afectados por la atenuación de la información causada por la agregación de tokens. Al mismo tiempo, la gran cantidad de tokens de video también genera un alto coste computacional. Para abordar estos problemas, el Instituto de Inteligencia Artificial de Beijing, en colaboración con varias universidades como la Universidad Jiao Tong de Shanghai, la Universidad del Pueblo Chino, la Universidad de Pekín y la Universidad de Ciencia y Tecnología de Beijing, ha propuesto Vide...