MiniGPT4-Video
Ein KI-Videomodell, das komplexe Videos versteht und dazu passende Gedichte verfassen kann.
Normales ProduktVideoVideoverständnisVideo-Frage-Antwort
MiniGPT4-Video ist ein multimodales großes Sprachmodell für das Videoverständnis. Es verarbeitet zeitliche visuelle und Textdaten und erstellt Titel und Werbetexte. Es eignet sich für Video-Frage-Antwort-Systeme. Basierend auf MiniGPT-v2 und dem visuellen Backbone EVA-CLIP wurde es in mehreren Phasen trainiert, einschließlich umfangreicher Video-Text-Vorabtrainierung und Feinabstimmung für Video-Frage-Antwort-Aufgaben. Es erzielte signifikante Verbesserungen auf den Benchmarks MSVD, MSRVTT, TGIF und TVQA. Die Preisgestaltung ist unbekannt.
MiniGPT4-Video Neueste Verkehrssituation
Monatliche Gesamtbesuche
1900
Absprungrate
58.75%
Durchschnittliche Seiten pro Besuch
1.3
Durchschnittliche Besuchsdauer
00:00:01