Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas

Sesame lança modelo CSM: síntese de voz com IA e personalização de emoções em tempo real atinge um novo nível

AIbase基地

Publicado emNotícias e Informações de IA · 3 minutos de leitura · Mar 14, 2025

Em 13 de março, a empresa Sesame lançou seu mais recente modelo de síntese de voz, o CSM, gerando grande interesse na indústria. De acordo com a empresa, o CSM utiliza uma arquitetura de aprendizado multimodal baseada em Transformer de ponta a ponta, capaz de compreender o contexto e gerar voz natural e expressiva, com qualidade de som impressionante e próxima à voz humana.

O modelo suporta geração de voz em tempo real, podendo processar entradas de texto e áudio. Os usuários também podem controlar características como tom, entonação, ritmo e emoção através de ajustes de parâmetros, demonstrando alta flexibilidade.

O CSM é considerado um avanço significativo na tecnologia de voz de IA. Sua naturalidade de voz é tão alta que é "quase impossível diferenciar se é uma síntese artificial ou uma voz humana". Alguns usuários gravaram vídeos mostrando o desempenho quase sem latência do CSM, chamando-o de "o melhor modelo já experimentado". Anteriormente, a Sesame lançou uma versão menor de código aberto, o CSM-1B, que suporta a geração de voz coerente em conversas de várias rodadas, recebendo amplos elogios.

Atualmente, o CSM é principalmente treinado em inglês e apresenta desempenho excelente, mas ainda tem limitações no suporte a vários idiomas. Atualmente, ele não suporta chinês, mas espera-se que essa funcionalidade seja expandida no futuro.

A Sesame afirma que irá disponibilizar parte dos resultados de pesquisa em código aberto, e desenvolvedores da comunidade já estão discutindo seu potencial no GitHub. O CSM não se aplica apenas à IA conversacional, mas também pode impulsionar a inovação na experiência de interação de voz em áreas como educação e entretenimento. Especialistas da indústria acreditam que o CSM pode remodelar o padrão dos assistentes de voz de IA, proporcionando uma interação humano-computador mais natural.

CSM modelo de síntese de voz Transformer Sesame

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Transformation instantanée ! Gamma lance un outil de conversion de contenu IA pour transformer documents et pages web en superbes pages de présentation

Le monde de la technologie est une fois de plus bouleversé ! La nouvelle fonctionnalité révolutionnaire de Gamma émerveille les créateurs de contenu : en quelques clics, transformez n'importe quel document ou page web en une page de présentation visuellement époustouflante, changeant radicalement la façon dont vous partagez l'information. Ce qui impressionne le plus dans cette fonctionnalité innovante, c'est sa simplicité extrême. Nul besoin de maîtriser des techniques complexes d'invite ou des connaissances approfondies en design ; il suffit de quelques clics de souris pour que le système extraie automatiquement l'essentiel du document et le transforme en une page de présentation structurée et visuellement attrayante. Le processus est pratiquement sans seuil, permettant à quiconque de...

Mar 17, 2025

UP do B站 “小虫哥_” clona a voz de personagens de Genshin Impact com o modelo de síntese de voz VITS

O UP do B站 “小虫哥_” lançou um vídeo de criação secundária de Genshin Impact, imitando a personagem Nahida, mantendo a voz original, com mais de 1,36 milhão de visualizações. O UP utilizou o modelo de síntese de voz VITS, carregando texto de voz para extrair características linguísticas e preservar o tom de voz único dos personagens de Genshin Impact. A tecnologia de clonagem de voz de IA já se popularizou, com ferramentas como HeyGen e AI Dubbing reduzindo a barreira de entrada. A atualização da tecnologia de IA atrai a atenção dos criadores, sendo crucial a criação de obras originais em termos de conteúdo e formato. O artigo explora os princípios do modelo VITS.

Nov 14, 2023

2.8k