MiniGPT4-Video

Modelo de video IA que comprende videos complejos y compone poemas con subtítulos.

Producto ComúnVideoComprensión de videoPreguntas y respuestas sobre video
MiniGPT4-Video es un modelo multimodal de gran escala diseñado para la comprensión de video. Puede procesar datos visuales temporales y de texto, generar títulos y eslóganes, y es adecuado para preguntas y respuestas sobre videos. Basado en MiniGPT-v2 y combinado con el backbone visual EVA-CLIP, se entrenó en múltiples etapas, incluyendo un pre-entrenamiento a gran escala de video-texto y un ajuste fino para preguntas y respuestas sobre videos. Ha logrado mejoras significativas en los benchmarks MSVD, MSRVTT, TGIF y TVQA. Precio desconocido.
Abrir sitio web

MiniGPT4-Video Situación del tráfico más reciente

Total de visitas mensuales

1900

Tasa de rebote

58.75%

Páginas promedio por visita

1.3

Duración promedio de la visita

00:00:01

MiniGPT4-Video Tendencia de visitas

MiniGPT4-Video Distribución geográfica de las visitas

MiniGPT4-Video Fuentes de tráfico

MiniGPT4-Video Alternativas