Recentemente, a Adobe Research, em colaboração com a Northwestern University, desenvolveu um sistema de inteligência artificial chamado Sketch2Sound, uma ferramenta que promete revolucionar a maneira como os designers de som trabalham. O Sketch2Sound permite que os usuários criem efeitos sonoros e atmosferas profissionais simplesmente cantarolando, imitando sons ou descrevendo-os com texto simples.

O sistema analisa três elementos-chave da entrada vocal do usuário: volume, timbre (que determina o brilho ou escuridão do som) e altura. Em seguida, combina essas características com a descrição de texto do usuário para gerar o som desejado. Por exemplo, se o usuário inserir "atmosfera de floresta" e emitir um som curto, o sistema automaticamente reconhece esse som como o canto de um pássaro, sem instruções específicas.

image.png

Outro destaque do Sketch2Sound é sua capacidade de entender o contexto. Ao criar música, o usuário pode inserir "baixo, caixa" e cantarolar o ritmo. O sistema inteligentemente posicionará o baixo nas notas graves e a caixa nas notas agudas. Esse processamento inteligente simplifica enormemente o processo de design de som.

Para atender às necessidades de profissionais, a equipe de pesquisa também integrou uma tecnologia de filtragem especial, permitindo que os usuários ajustem a precisão do som gerado conforme necessário. Os designers de som podem optar por um controle muito preciso ou por uma abordagem mais relaxada e aproximada. Essa flexibilidade pode tornar o Sketch2Sound especialmente popular entre os artistas Foley. Esses profissionais, responsáveis pela criação de efeitos sonoros para filmes e programas de televisão, poderão criar efeitos mais rapidamente usando som e descrições de texto, sem precisar manipular objetos físicos para produzir sons.

Embora os pesquisadores apontem que as características de áudio espacial nas gravações de entrada às vezes afetam negativamente o som gerado, eles estão trabalhando para resolver esse problema. Atualmente, a Adobe ainda não anunciou se o Sketch2Sound será lançado como um produto comercial ou sua data de lançamento.

Acesso ao projeto:https://hugofloresgarcia.art/sketch2sound/

Destaques:

🎵 Sketch2Sound é uma nova ferramenta de IA que cria efeitos sonoros a partir de cantarolar e descrições de texto.

🔊 O sistema analisa o volume, o timbre e a altura, combinando a entrada de voz do usuário com o texto para gerar o efeito sonoro desejado.

🎬 Ideal para artistas Foley, permitindo a geração rápida de efeitos sonoros para cinema e televisão, aumentando a eficiência do trabalho.