Seed-ASR
Tecnología de reconocimiento de voz basada en modelos lingüísticos de gran tamaño.
Nuevo Producto PremiumOtrosReconocimiento de vozModelos lingüísticos de gran tamaño
Seed-ASR es un modelo de reconocimiento de voz basado en modelos lingüísticos de gran tamaño (Large Language Model, LLM) desarrollado por ByteDance. Al introducir la representación continua del habla y la información contextual en el LLM, y aprovechando las capacidades del LLM, guiado por el entrenamiento a gran escala y la capacidad de comprensión contextual, se ha mejorado significativamente el rendimiento en conjuntos de evaluación integrales que incluyen múltiples dominios, acentos/dialectos e idiomas. En comparación con los modelos ASR de gran tamaño lanzados recientemente, Seed-ASR ha logrado una reducción del 10% al 40% en la tasa de error de palabras en conjuntos de pruebas públicos de chino e inglés, lo que demuestra aún más su potente rendimiento.
Seed-ASR Situación del tráfico más reciente
Total de visitas mensuales
16826
Tasa de rebote
42.75%
Páginas promedio por visita
2.8
Duración promedio de la visita
00:02:20