VSP-LLM
Marco que combina el procesamiento visual del habla con modelos de lenguaje grandes
Producto ComúnProgramaciónProcesamiento visual del hablaModelos de lenguaje grandes
VSP-LLM es un marco que combina el procesamiento visual del habla (Visual Speech Processing) con modelos de lenguaje grandes (LLM), diseñado para maximizar la capacidad de modelado contextual mediante la potencia de los LLM. VSP-LLM está diseñado para realizar múltiples tareas de reconocimiento y traducción de voz visual, mapeando videos de entrada a un espacio latente de entrada de LLM a través de un modelo de voz visual autosupervisado. Este marco permite un entrenamiento eficiente mediante un novedoso método de desduplicación y adaptadores de bajo rango (LoRA).
VSP-LLM Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34