Meta lanza un nuevo modelo de traducción de voz que imita el tono y la velocidad

量子位

Publicado elNoticias de IA · 2 minutos de lectura · Dec 21, 2023

Meta ha lanzado recientemente la serie de modelos de traducción de voz Seamless Communication, que incluye cuatro modelos y admite la traducción de voz en tiempo real entre casi 100 idiomas, con un retraso de alrededor de 2 segundos. Los modelos pueden replicar características complejas del habla original, como las pausas, el tono y la velocidad, lo que hace que la traducción sea más realista. Emplean una arquitectura no autorregresiva para admitir la traducción de secuencias largas. Además, Meta también ha publicado el código abierto de los modelos y el corpus de voz más grande del mundo, con 585.000 horas de datos, y ha añadido funciones como marcas de agua de audio y mitigación de la toxicidad de la traducción para evitar el mal uso del modelo.

DeepL lanza DeepL Voice: Herramienta de traducción de voz en tiempo real para reuniones y conversaciones multilingües

DeepL, líder mundial en inteligencia artificial para idiomas, ha lanzado recientemente DeepL Voice, una nueva herramienta de traducción de voz en tiempo real diseñada para facilitar la comunicación fluida entre diferentes idiomas. Con una valoración de 2000 millones de dólares, DeepL ocupa una posición destacada en soluciones lingüísticas para empresas e individuos. DeepL Voice, el primer producto de la compañía centrado en la traducción de voz, amplía sus conocidos servicios de traducción de texto ofreciendo traducción en tiempo real para interacciones multilingües en entornos presenciales o virtuales.

Informe financiero del tercer trimestre de Meta: crecimiento sólido del negocio principal, pero pérdidas de 4400 millones de dólares en el metaverso

Meta (anteriormente Facebook) publicó recientemente su informe financiero del tercer trimestre de 2023. Si bien el negocio principal mostró un excelente desempeño, las enormes pérdidas del departamento del metaverso provocaron preocupación entre los inversores, lo que provocó una caída de más del 3% en el precio de las acciones en las operaciones posteriores al cierre. Este informe financiero muestra la compleja situación de crecimiento de Meta. Los datos muestran que, hasta el 30 de septiembre, los ingresos del tercer trimestre de Meta alcanzaron los 40 600 millones de dólares, un 19% más que el año anterior, superando las expectativas del mercado de 40 300 millones de dólares. Sin embargo, el departamento de Reality Labs, dedicado al metaverso, registró...

¿Conducción autónoma en el metaverso? ¡Juega con la IA de Gigai Tech para una reconstrucción de escenas 4D más fluida!

Recientemente, Gigai Tech propuso un nuevo marco llamado DriveDreamer4D, diseñado para utilizar el conocimiento previo del modelo del mundo para mejorar la reconstrucción de escenas de conducción 4D. Los métodos tradicionales de reconstrucción de escenas 4D se basan principalmente en dos escuelas de pensamiento: NeRF y 3DGS. NeRF es como un súper pintor que utiliza redes neuronales para representar un conjunto de fotografías en un modelo 3D. 3DGS, por otro lado, utiliza un conjunto de funciones gaussianas tridimensionales para simular varios objetos en la escena. Sin embargo, ambos métodos tienen un inconveniente...

Noticias de IA

Meta lanza un nuevo modelo de traducción de voz que imita el tono y la velocidad

量子位

Noticias de IA relacionadas recomendadas

NetEase Youdao lanza un nuevo modelo de traducción de parámetros pequeños de 14B para mejorar la precisión y la eficiencia de la traducción

DeepL lanza DeepL Voice: Herramienta de traducción de voz en tiempo real para reuniones y conversaciones multilingües

Informe financiero del tercer trimestre de Meta: crecimiento sólido del negocio principal, pero pérdidas de 4400 millones de dólares en el metaverso

¿Conducción autónoma en el metaverso? ¡Juega con la IA de Gigai Tech para una reconstrucción de escenas 4D más fluida!