AudioSep

Modèle de séparation de sources audio en domaine ouvert basé sur des requêtes en langage naturel

Produit OrdinaireMusiqueSéparation audioRequête en langage naturel

AudioSep est un modèle de séparation de sources audio en domaine ouvert basé sur des requêtes en langage naturel. Il se compose de deux composants clés : un encodeur de texte et un modèle de séparation. Nous avons entraîné AudioSep sur un ensemble de données multimodales à grande échelle et évalué ses capacités sur de nombreuses tâches, notamment la séparation d'événements audio, la séparation d'instruments et l'amélioration de la parole. AudioSep affiche des performances de séparation robustes et une capacité de généralisation zéro-shot impressionnante, surpassant largement les modèles précédents de séparation audio basés sur des requêtes audio ou textuelles, en utilisant des titres audio ou des étiquettes textuelles comme requêtes. Pour assurer la reproductibilité de ce travail, nous publierons le code source, les benchmarks d'évaluation et les modèles pré-entraînés.

Best AI Websites & Tools

AudioSep

AudioSep Dernière situation du trafic

AudioSep Tendance des visites

AudioSep Distribution géographique des visites

AudioSep Sources de trafic

AudioSep Alternatives

AudioSep — Modèle de séparation de sources audio en domaine ouvert basé sur des requêtes en langage naturel

UVR5-UI — Ultimate Vocal Remover 5 avec interface utilisateur Gradio, pour séparer les fichiers audio.

Ultimate Vocal Remover GUI — Outil gratuit de suppression vocale - Extraction des pistes d'accompagnement musicales

Soundify — Soundify est un outil d'édition audio basé sur l'IA.

InspireMusic — Boîte à outils de génération de musique, de chansons et d'audio basée sur PyTorch, prenant en charge la génération audio haute fidélité.

Narrative BI AI Data Analyst — Narrative BI AI Data Analyst offre des analyses de données par IA générative et des requêtes en langage naturel, permettant aux utilisateurs d'obtenir rapidement des informations pertinentes.

AIVocal — Outil de suppression vocale en ligne basé sur l'IA

OmniAudio-2.6B — Le modèle linguistique audio pour déploiement périphérique le plus rapide au monde

Vocal Remover Online — Outil de suppression vocale en ligne, permettant de séparer l'accompagnement musical et la voix.

ComfyUI-MMAudio — Noeud ComfyUI pour le traitement audio avec le modèle MMAudio

Auralis — Moteur de synthèse vocale rapide

SongCleaner — Technologie IA pour supprimer les mots inappropriés des chansons

Suno v4 — Plateforme de création musicale offrant une création audio et lyricale de haute qualité.

Application Moises — Outil de séparation audio IA pour musiciens

Mikrotakt — Utilise la technologie IA de pointe pour extraire les voix, les accompagnements et autres éléments audio à partir de chansons ou de vidéos.

OuteTTS-0.1-350M — Modèle de synthèse vocale texte-à-parole basé sur un modèle linguistique pur.

hertz-dev — Modèle de base de génération audio full-duplex open source

Fish Agent V0.1 3B — Modèle de synthèse vocale capable de capturer et de générer des informations audio environnementales avec une grande précision.

Browser AI Kit — Boîte à outils d'IA fonctionnant directement dans votre navigateur

Universal-2 — IA vocale de nouvelle génération offrant des capacités exceptionnelles de traitement de données audio.

Cartesia Changeur de Voix — Technologie de changement de voix audio, convertissant la voix tout en préservant l'expression et les émotions originales.

EaseUS Vocal Remover (Séparateur de voix) — Utilise l'intelligence artificielle pour séparer la voix et l'accompagnement musical des fichiers audio et vidéo.

DiariZen — Une boîte à outils pour la segmentation des locuteurs

AILIBRI — Un répertoire complet d'outils de réseaux neuronaux d'IA

EzAudio — Modèle de haute qualité pour la génération texte-à-audio.

Seed-Music — Système de génération musicale prenant en charge la génération vocale multilingue et l'édition musicale.

seed-vc — Technologie de conversion vocale zéro-shot, permettant une conversion haute-fidélité de la qualité et du timbre.

Boîte à outils vocale Easy Voice — Boîte à outils vocale IA déployable localement, prenant en charge la reconnaissance vocale, la transcription et la conversion.

Chat Audio — Téléchargez vos fichiers audio et analysez facilement vos conversations.

Pandrator — Générateur de livres audio et de doublage GUI open source.