Parler-TTS

Gera áudio de alta qualidade e natural.

Novo Produto PremiumProdutividadeTTSGeração de voz

Parler-TTS é um modelo leve de texto para fala (TTS) desenvolvido pela Hugging Face, capaz de gerar áudio de alta qualidade e natural com o estilo de um determinado falante (gênero, tom, estilo de fala, etc.). É uma recriação do trabalho publicado por Dan Lyth e Simon King, intitulado "Natural language guidance of high-fidelity text-to-speech with synthetic annotations", autores da Stability AI e da Universidade de Edimburgo, respectivamente. Diferentemente de outros modelos TTS, o Parler-TTS é totalmente de código aberto, incluindo o conjunto de dados, pré-processamento, código de treinamento e pesos. Suas funcionalidades incluem: geração de saída de áudio de alta qualidade e natural; uso e implementação flexíveis; e um rico conjunto de dados de áudio anotados. Preço: Gratuito.

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

Parler-TTS

Parler-TTS Situação do Tráfego Mais Recente

Parler-TTS Tendência de Visitas

Parler-TTS Distribuição Geográfica das Visitas

Parler-TTS Fontes de Tráfego

Parler-TTS Alternativas

Parler-TTS — Gera áudio de alta qualidade e natural.

EasyControl Ghibli — O novo modelo EasyControl Ghibli já está disponível!

Smallest AI — Oferece serviços de geração de voz em IA em tempo real e atendimento ao cliente por IA, ajudando as empresas a melhorar a experiência do cliente.

kokoro-onnx — Projeto de texto para fala (TTS) baseado no Kokoro e no tempo de execução ONNX.

Llama-3.1-70B-Instruct-AWQ-INT4 — Modelo de geração de texto com 70 bilhões de parâmetros

Llama-Lynx-70b-4bit-Quantizado — Modelo de geração de texto quantizado de 70 bilhões de parâmetros

Llama-lynx-70b-4bitAWQ — Modelo de geração de texto com 7 bilhões de parâmetros

glider-gguf — Modelo de linguagem quantizado de alto desempenho

OCTAVE — Modelo de linguagem de voz de próxima geração, com capacidade de criar sons e personalidades instantaneamente.

ElevenLabs Flash — Modelo TTS de geração de voz humana rápida

FastHunyuan — Modelo para geração rápida de vídeos de alta qualidade

Recursal AI — Tornando a inteligência artificial acessível a todos

InternVL2_5-26B — Modelo de linguagem grande multimodal, integrando compreensão visual e linguística.

FineWeb2 — Conjunto de dados de pré-treinamento multilíngue

Auralis — Motor de texto para fala (TTS) rápido

PocketPal AI — Aplicativo de bate-papo com IA, oferecendo uma experiência de conversa segura e privada.

OLMo-2-1124-7B-Instruct — Modelo de geração de diálogo em inglês de alto desempenho

OLMo 2 7B — Modelo de linguagem extenso com 7B de parâmetros, aprimorando a capacidade de processamento de linguagem natural.

Skywork-o1-Open-PRM-Qwen-2.5-1.5B — Modelo da série Skywork o1 Open, aprimorando a capacidade de resolução de problemas complexos.

FLUX.1-dev-IP-Adapter — IP-Adapter baseado no modelo FLUX.1-dev, permitindo a manipulação de imagens com a flexibilidade de texto.

SD3.5-Large-IP-Adapter — Adaptador IP baseado no modelo Stable Diffusion 3.5 Large

ClipTurbo — Ferramenta de geração de vídeo impulsionada por IA, que gera vídeos de marketing de alta qualidade com um único clique.

Artefatos do Qwen2.5 Coder — Conjunto de ferramentas de programação fornecidas pelo Qwen no Hugging Face.

MobileLLM-350M — Modelo de linguagem eficiente e otimizado com menos de um bilhão de parâmetros, projetado para aplicações em dispositivos.

hertz-dev — Modelo base de geração de áudio full-duplex de código aberto

Ortlin — Ortlin é uma interface web para interação com modelos e APIs do OpenAI.

Aya Expanse — Hugging Face Space desenvolvido pela CohereForAI

Demonstração MaskGCT TTS — Demonstração de texto para fala (TTS) baseada no modelo MaskGCT

Reverb — Código de inferência de modelo de reconhecimento de fala e separação de locutores de código aberto

Voice-Pro — Interface Web Gradio para transcrição, tradução e TTS de áudio com IA