Recientemente, aiOla anunció el lanzamiento de Whisper-NER, un modelo de transcripción de audio de IA de código abierto que puede censurar información sensible en tiempo real durante el proceso de transcripción.

El nuevo Whisper-NER de aiOla se basa en el modelo de código abierto estándar de la industria Whisper de OpenAI, y es completamente de código abierto. Ahora está disponible en Hugging Face y Github para que empresas, organizaciones e individuos lo utilicen, adapten, modifiquen e implementen.

image.png

Este modelo de transcripción de audio cuenta con opciones de configuración flexibles. Los usuarios pueden elegir si desean censurar o no la información sensible. Cuando se selecciona la función de censura, el modelo identifica y oculta automáticamente información sensible como nombres personales, direcciones y números de teléfono, evitando eficazmente la filtración de privacidad en la transcripción. Esta capacidad es especialmente importante en campos como el legal, la medicina y la educación.

Además de proteger la información sensible, el modelo ofrece una capacidad de transcripción precisa y eficiente, funcionando correctamente con múltiples idiomas y acentos. Esto amplía su aplicación a entornos multilingües. Por ejemplo, las empresas pueden registrar y analizar con precisión la información de audio de diferentes regiones al gestionar las opiniones de los clientes, mejorando así la calidad del servicio.

Asimismo, aiOla anima a los desarrolladores e investigadores a utilizar este modelo de código abierto para mejorar aún más sus funciones. Los usuarios pueden obtener el código fuente en la plataforma de código abierto y modificarlo y optimizarlo según sus necesidades. Esta práctica no solo mejora la usabilidad del modelo, sino que también impulsa la innovación y el desarrollo de la tecnología de IA.

Este nuevo producto de aiOla demuestra la importancia que se le da a la protección de la privacidad en el campo de la transcripción de audio, y abre más posibilidades para las futuras aplicaciones de IA. Con la participación de más usuarios y desarrolladores, esperamos que este modelo de código abierto genere un impacto y aplicaciones más amplias.

Whisper-NER es completamente de código abierto y se puede utilizar bajo la licencia MIT, lo que permite a los usuarios adoptarlo, modificarlo e implementarlo libremente, incluso para aplicaciones comerciales. Actualmente, los usuarios también pueden probar un modelo de demostración en Hugging Face, que les permite grabar clips de voz y hacer que el modelo oculte palabras específicas que escriban en la transcripción generada.

huggingface:https://huggingface.co/aiola/whisper-ner-v1

github:https://github.com/aiola-lab/whisper-ner

Puntos clave:

📌 El modelo de transcripción de audio de aiOla puede censurar información sensible en tiempo real, protegiendo la privacidad del usuario.

🔍 El modelo admite múltiples idiomas y acentos, siendo adecuado para diversos campos como el legal, la medicina y la educación.

💻 La naturaleza de código abierto permite a los usuarios personalizar y optimizar el modelo, fomentando la innovación en la tecnología de IA.