Stability AI e Arm se unem para lançar tecnologia de geração de áudio offline

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Mar 4, 2025

15.9k

A Stability AI é conhecida por seu modelo de geração de imagens a partir de texto, Stable Diffusion. Recentemente, a empresa se uniu à Arm, gigante global de semicondutores, para trazer a capacidade de inteligência artificial generativa de áudio para dispositivos móveis. Essa parceria permite que o modelo Stable Audio Open rode completamente na CPU Arm, permitindo que os usuários gerem efeitos sonoros, amostras de áudio e elementos de produção rapidamente em seus dispositivos, sem necessidade de conexão com a internet.

A Stability AI afirma que, com a crescente adoção da inteligência artificial generativa por empresas e criadores profissionais, garantir que nossos modelos e fluxos de trabalho sejam facilmente acessíveis em todos os campos criativos é crucial. Isso não apenas aumenta a eficiência criativa, mas também ajuda a integrar perfeitamente essas tecnologias nos fluxos de trabalho de produção de mídia visual.

Para atender à crescente demanda, a empresa visa melhorar a eficiência de seus modelos em dispositivos de borda. Ao otimizar o modelo Stable Audio Open para dispositivos móveis, os testes iniciais levaram 240 segundos para gerar áudio em um dispositivo com CPU Arm. Através da destilação do modelo e da utilização da pilha de software da Arm, especialmente o núcleo de multiplicação de matriz int8 do KleidiAI via XNNPack, a empresa conseguiu reduzir o tempo de geração de um fragmento de áudio de 11 segundos para 8 segundos, representando uma melhoria de 30 vezes na velocidade de resposta.

É importante notar que os usuários precisam de um dispositivo móvel compatível para usar este recurso. Considerando que a maioria dos smartphones atuais possui CPUs com arquitetura Arm, essa tecnologia se torna acessível a uma ampla gama de usuários. No futuro, a Stability AI planeja trazer todos os seus modelos nas áreas de imagem, vídeo e 3D para dispositivos de borda, visando revolucionar a criação de mídia visual em dispositivos móveis.

Destaques:
🌟 A Stability AI, em parceria com a Arm, lança tecnologia de geração de áudio offline em dispositivos móveis.
⚡ Através da destilação do modelo e otimização de software, o tempo de geração de áudio foi reduzido de 240 segundos para 8 segundos, uma melhoria de 30 vezes na eficiência.
📱 Essa tecnologia funciona na maioria dos smartphones com CPU Arm, e será expandida para mais áreas de criação de mídia no futuro.

Amazon se junta ao C2PA para combater a disseminação de conteúdo gerado por IA!

Deepfakes e mídias sintéticas estão se tornando cada vez mais comuns devido ao avanço da inteligência artificial generativa (IA generativa). Para enfrentar esse desafio, muitas organizações estão trabalhando em tecnologias de marca d'água digital para rastrear a origem do conteúdo. Embora ainda não haja uma solução perfeita, a Coalizão para a Proveniência e Autenticidade de Conteúdo (C2PA) está crescendo. A C2PA anunciou que a Amazon se juntou ao seu conselho diretor. A C2PA é um padrão técnico aberto hospedado pela Fundação Linux.

Singapura planeja legislar contra o uso de deepfakes durante eleições

Singapura propôs recentemente um novo projeto de lei que visa proibir o uso de deepfakes durante as eleições, a fim de garantir a autenticidade das informações e a justiça eleitoral. Com o desenvolvimento da inteligência artificial generativa, o risco de conteúdo deepfake aumentou, e o projeto de lei visa regular o conteúdo falso criado usando IA e outras tecnologias não relacionadas à IA, incluindo vídeos, áudios e imagens. A proibição central se concentra em anúncios online falsos que retratam falsamente as palavras ou ações de candidatos durante as eleições, com penalidades que incluem multas ou prisão para infratores. O projeto de lei também permite a emissão de ordens de correção para indivíduos e plataformas de mídia social que publicam conteúdo falso.

Google combate deepfakes não consensuais, elevando a segurança cibernética

O Google tomou medidas recentemente para combater o conteúdo de deepfakes não consensuais, respondendo às preocupações do público e à pressão legislativa. Após o incidente com Taylor Swift, há oito meses, empresas de tecnologia e legisladores começaram a levar o assunto a sério. O Google anunciou medidas para evitar que deepfakes de natureza sexual apareçam nos resultados de pesquisa, incluindo simplificar o processo de remoção de imagens de exploração sexual não consensuais para vítimas, filtrar resultados de pesquisa de natureza sexual, remover imagens duplicadas e otimizar os resultados de pesquisa para reduzir a exposição a deepfakes. Henry Ajder aprova as medidas do Google, acreditando que elas reduzirão significativamente a exposição de conteúdo não consensual.

32% das organizações já implantaram inteligência artificial generativa

32% das organizações já utilizam inteligência artificial generativa em aplicações empresariais. 60% das organizações estão mais preocupadas com a segurança da inteligência artificial generativa. 58% das organizações adotam principalmente o modelo de linguagem de grande porte GPT-4 da OpenAI. Dados da pesquisa mostram que 75% das organizações atualmente usam modelos de linguagem de grande porte.