VSP-LLM
Ein Framework, das visuelle Sprachverarbeitung und große Sprachmodelle kombiniert.
Normales ProduktProgrammierungVisuelle SprachverarbeitungGroße Sprachmodelle
VSP-LLM ist ein Framework, das visuelle Sprachverarbeitung (Visual Speech Processing, VSP) und große Sprachmodelle (LLMs) kombiniert. Es zielt darauf ab, die Kontextmodellierung mit der Leistungsfähigkeit von LLMs zu maximieren. VSP-LLM ist für die Ausführung multipler Aufgaben in der visuellen Spracherkennung und -übersetzung konzipiert. Es nutzt ein selbstüberwachtes visuell-sprachliches Modell, um Eingangsvideos in den latenten Eingangsraum des LLM zu kartieren. Das Framework ermöglicht effizientes Training durch eine neuartige Deduplizierungsmethode und Low-Rank-Adapter (LoRA).
VSP-LLM Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34