VSP-LLM

Ein Framework, das visuelle Sprachverarbeitung und große Sprachmodelle kombiniert.

Normales ProduktProgrammierungVisuelle SprachverarbeitungGroße Sprachmodelle
VSP-LLM ist ein Framework, das visuelle Sprachverarbeitung (Visual Speech Processing, VSP) und große Sprachmodelle (LLMs) kombiniert. Es zielt darauf ab, die Kontextmodellierung mit der Leistungsfähigkeit von LLMs zu maximieren. VSP-LLM ist für die Ausführung multipler Aufgaben in der visuellen Spracherkennung und -übersetzung konzipiert. Es nutzt ein selbstüberwachtes visuell-sprachliches Modell, um Eingangsvideos in den latenten Eingangsraum des LLM zu kartieren. Das Framework ermöglicht effizientes Training durch eine neuartige Deduplizierungsmethode und Low-Rank-Adapter (LoRA).
Website öffnen

VSP-LLM Neueste Verkehrssituation

Monatliche Gesamtbesuche

474564576

Absprungrate

36.20%

Durchschnittliche Seiten pro Besuch

6.1

Durchschnittliche Besuchsdauer

00:06:34

VSP-LLM Besuchstrend

VSP-LLM Geografische Verteilung der Besuche

VSP-LLM Traffic-Quellen

VSP-LLM Alternativen