Parler-TTS

Génère une voix de haute qualité et naturelle.

Nouveau Produit PremiumProductivitéTTSGénération vocale

Parler-TTS est un modèle léger de texte à parole (TTS) développé par Hugging Face, capable de générer une voix de haute qualité et naturelle, dans le style d'un locuteur donné (genre, tonalité, style de parole, etc.). Il s'agit d'une reproduction du travail de Dan Lyth et Simon King, publié dans l'article « Natural language guidance of high-fidelity text-to-speech with synthetic annotations », respectivement de Stability AI et de l'université d'Édimbourg. Contrairement à d'autres modèles TTS, Parler-TTS est entièrement open source, incluant les données, le prétraitement, le code d'entraînement et les poids. Ses fonctionnalités incluent : la génération d'une sortie vocale de haute qualité et naturelle, une utilisation et un déploiement flexibles, et un ensemble de données vocales annotées riche. Prix : gratuit.

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

Parler-TTS

Parler-TTS Dernière situation du trafic

Parler-TTS Tendance des visites

Parler-TTS Distribution géographique des visites

Parler-TTS Sources de trafic

Parler-TTS Alternatives

Parler-TTS — Génère une voix de haute qualité et naturelle.

EasyControl Ghibli — Le nouveau modèle EasyControl Ghibli est désormais disponible !

Smallest AI — Fournit des services de génération vocale IA et d'agents de service client IA en temps réel, pour aider les entreprises à améliorer l'expérience client.

kokoro-onnx — Projet de synthèse vocale (TTS) basé sur le runtime Kokoro et ONNX.

Llama-3.1-70B-Instruct-AWQ-INT4 — Modèle de génération de texte de 70 milliards de paramètres

Llama-Lynx-70b-4bit-Quantized — Modèle de génération de texte quantifié de 7 milliards de paramètres

Llama-lynx-70b-4bitAWQ — Modèle de génération de texte de 7 milliards de paramètres

glider-gguf — Modèle linguistique quantifié haute performance

OCTAVE — Modèle linguistique vocal de nouvelle génération capable de créer instantanément des voix et des personnalités.

ElevenLabs Flash — Modèle TTS générant rapidement une voix humaine

FastHunyuan — Modèle de génération vidéo haute qualité rapide

Recursal AI — Rendre l'intelligence artificielle accessible à tous

InternVL2_5-26B — Modèle linguistique de grande taille multi-modalité, fusionnant compréhension visuelle et linguistique.

FineWeb2 — Ensemble de données pré-entraîné multilingue

Interface Web de l'Agent de Traduction — Une interface web d'agent de traduction basée sur Gradio.

Auralis — Moteur de synthèse vocale rapide

PocketPal AI — Application de chat IA offrant une expérience de conversation sécurisée et privée.

OLMo-2-1124-7B-Instruct — Modèle de génération de dialogue anglais haute performance

OLMo 2 7B — Modèle linguistique de grande taille (7 milliards de paramètres) améliorant les capacités de traitement du langage naturel.

Skywork-o1-Open-PRM-Qwen-2.5-1.5B — Modèle de la série Skywork o1 Open, améliorant la résolution de problèmes complexes.

FLUX.1-dev-IP-Adapter — Adaptateur IP basé sur le modèle FLUX.1-dev, offrant une flexibilité comparable à celle du texte pour le traitement d'images.

Adaptateur IP SD3.5-Large — Adaptateur IP basé sur le modèle Stable Diffusion 3.5 Large

ClipTurbo — Outil de génération vidéo IA, création de vidéos marketing de haute qualité en un clic

Outils de Programmation Qwen2.5 Coder Artifacts — Ensemble d'outils de programmation fournis par Qwen sur Hugging Face

LLaMA-O1 — Framework de modèle d'inférence à grande échelle, compatible avec PyTorch et Hugging Face.

MobileLLM-350M — Modèle linguistique optimisé de moins d'un milliard de paramètres, conçu pour les applications embarquées.

hertz-dev — Modèle de base de génération audio full-duplex open source

Ortlin — Ortlin est une interface web permettant d'interagir avec les modèles et les API d'OpenAI.

Aya Expanse — Espace Hugging Face développé par CohereForAI

Démo TTS MaskGCT — Démonstration de texte à parole (TTS) basée sur le modèle MaskGCT