SALMONN
SALMONN: Red neuronal abierta de lenguaje, audio y música
Producto ComúnProductividadVozAudio
SALMONN es un gran modelo de lenguaje (LLM) desarrollado por el Departamento de Ingeniería Electrónica de la Universidad Tsinghua y ByteDance. Admite entrada de voz, eventos de audio y música. A diferencia de los modelos que solo admiten entrada de voz o eventos de audio, SALMONN puede percibir y comprender diversas entradas de audio, lo que le otorga capacidades emergentes como el reconocimiento y la traducción de voz multilingüe, y la inferencia conjunta de audio y voz. Esto puede considerarse como dotar al LLM de "oído" y capacidad de audición cognitiva, convirtiendo a SALMONN en un paso hacia una inteligencia artificial general con capacidad auditiva.
SALMONN Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34