Recentemente, a aiOla anunciou o lançamento do Whisper-NER, um modelo de transcrição de áudio de IA de código aberto que pode mascarar informações sensíveis em tempo real durante o processo de transcrição.

O novo Whisper-NER da aiOla é construído sobre o modelo de código aberto padrão do setor Whisper da OpenAI, sendo totalmente de código aberto e agora disponível no Hugging Face e no Github para uso, adaptação, modificação e implantação por empresas, organizações e indivíduos.

image.png

O modelo de transcrição de áudio possui opções de configuração flexíveis. Os usuários podem escolher se desejam ou não mascarar informações sensíveis. Quando a função de mascaramento é selecionada, o modelo identifica e oculta automaticamente informações sensíveis, como nomes pessoais, endereços e números de telefone, evitando eficazmente vazamentos de privacidade no texto transcrito. Essa capacidade torna o modelo particularmente importante em cenários de aplicação em áreas como direito, saúde e educação.

Além da proteção de informações sensíveis, o modelo também possui capacidade de transcrição eficiente e precisa, funcionando em várias línguas e sotaques. Isso amplia sua aplicabilidade em ambientes multilínguas. Por exemplo, empresas podem registrar e analisar com precisão informações de áudio de diferentes regiões ao lidar com feedback de clientes, melhorando assim a qualidade do serviço.

Além disso, a aiOla incentiva desenvolvedores e pesquisadores a usar este modelo de código aberto para melhorar ainda mais suas funcionalidades. Os usuários podem obter o código-fonte na plataforma de código aberto e modificá-lo e otimizá-lo de acordo com suas necessidades. Essa prática não apenas melhora a usabilidade do modelo, mas também promove a inovação e o desenvolvimento da tecnologia de IA.

Este novo produto da aiOla demonstra a importância dada à proteção de privacidade no campo da transcrição de áudio e abre mais possibilidades para aplicações futuras de IA. Com a participação de mais usuários e desenvolvedores, espera-se que este modelo de código aberto gere aplicações e impactos mais amplos.

O Whisper-NER é totalmente de código aberto e pode ser usado sob a licença MIT, permitindo que os usuários o adotem, modifiquem e implantem livremente, incluindo para aplicativos comerciais. Os usuários agora também podem experimentar um modelo de demonstração no Hugging Face, permitindo que gravem clipes de voz e façam o modelo mascarar palavras específicas que eles digitam no script digitado gerado.

huggingface:https://huggingface.co/aiola/whisper-ner-v1

github:https://github.com/aiola-lab/whisper-ner

Destaques:

📌 O modelo de transcrição de áudio da aiOla pode mascarar informações sensíveis em tempo real, protegendo a privacidade do usuário.

🔍 O modelo suporta várias línguas e sotaques, sendo adequado para vários setores, incluindo direito, saúde e educação.

💻 O recurso de código aberto permite que os usuários personalizem e otimizem o modelo, promovendo a inovação em tecnologia de IA.