VSP-LLM

Marco que combina el procesamiento visual del habla con modelos de lenguaje grandes

Producto ComúnProgramaciónProcesamiento visual del hablaModelos de lenguaje grandes
VSP-LLM es un marco que combina el procesamiento visual del habla (Visual Speech Processing) con modelos de lenguaje grandes (LLM), diseñado para maximizar la capacidad de modelado contextual mediante la potencia de los LLM. VSP-LLM está diseñado para realizar múltiples tareas de reconocimiento y traducción de voz visual, mapeando videos de entrada a un espacio latente de entrada de LLM a través de un modelo de voz visual autosupervisado. Este marco permite un entrenamiento eficiente mediante un novedoso método de desduplicación y adaptadores de bajo rango (LoRA).
Abrir sitio web

VSP-LLM Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

VSP-LLM Tendencia de visitas

VSP-LLM Distribución geográfica de las visitas

VSP-LLM Fuentes de tráfico

VSP-LLM Alternativas