El marco SALMONN, al integrar diferentes codificadores auditivos y una etapa de ajuste de activación, ha logrado un rendimiento auditivo universal competitivo. Su arquitectura multimodal permite a los grandes modelos de lenguaje comprender y procesar directamente entradas de audio generales, mostrando un rendimiento competitivo en diversas tareas.
Marco SALMONN: Ampliando las capacidades auditivas generales de los modelos lingüísticos grandes
