SlowFast-LLaVA
Ein vortrainiertes, großes Sprachmodell für Videoverständnis und -schlussfolgerung.
Normales ProduktProduktivitätVideo-Frage-AntwortMultimodales Lernen
SlowFast-LLaVA ist ein multimodales, großes Sprachmodell, das für Videoverständnis und -schlussfolgerung entwickelt wurde und kein Training benötigt. Es erreicht ohne Feinabstimmung auf beliebigen Daten in verschiedenen Video-Frage-Antwort-Aufgaben und Benchmarks eine Leistung, die mit den modernsten großen Video-Sprachmodellen vergleichbar ist oder diese sogar übertrifft.
SlowFast-LLaVA Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34