El marco SALMONN, al integrar diferentes codificadores auditivos y una etapa de ajuste de activación, ha logrado un rendimiento auditivo universal competitivo. Su arquitectura multimodal permite a los grandes modelos de lenguaje comprender y procesar directamente entradas de audio generales, mostrando un rendimiento competitivo en diversas tareas.