AudioSep

Modelo de separación de fuentes de audio de dominio abierto basado en consultas de lenguaje natural

Producto ComúnMúsicaSeparación de audioConsulta de lenguaje natural

AudioSep es un modelo de separación de fuentes de audio de dominio abierto basado en consultas de lenguaje natural. Se compone de dos componentes clave: un codificador de texto y un modelo de separación. Hemos entrenado AudioSep en un conjunto de datos multimodales a gran escala y evaluado ampliamente sus capacidades en diversas tareas, incluyendo la separación de eventos de audio, la separación de instrumentos y la mejora de voz. AudioSep demuestra un rendimiento de separación robusto y una impresionante capacidad de generalización de cero disparos, superando significativamente a los modelos previos de separación de audio basados en consultas de audio y lenguaje al utilizar títulos de audio o etiquetas de texto como consultas. Para garantizar la reproducibilidad de este trabajo, publicaremos el código fuente, los benchmarks de evaluación y los modelos preentrenados.

Best AI Websites & Tools

AudioSep

AudioSep Situación del tráfico más reciente

AudioSep Tendencia de visitas

AudioSep Distribución geográfica de las visitas

AudioSep Fuentes de tráfico

AudioSep Alternativas

AudioSep — Modelo de separación de fuentes de audio de dominio abierto basado en consultas de lenguaje natural

UVR5-UI — Ultimate Vocal Remover 5 con interfaz de usuario Gradio para separar archivos de audio.

MVSEP — MVSEP separa la voz y la música de un archivo de audio.

Eliminador de Voz Definitivo GUI — Herramienta gratuita para separar voces. Separa la música de fondo y extrae la pista instrumental.

Soundify — Soundify es una herramienta de edición de audio impulsada por IA.

InspireMusic — Kit de herramientas y modelos para la generación de música, canciones y audio basado en PyTorch, que admite la generación de audio de alta calidad.

AIVocal — Herramienta de eliminación de voz humana en línea con IA

OmniAudio-2.6B — El modelo de lenguaje de audio para despliegue perimetral más rápido del mundo

Eliminador de Voz Online — Herramienta online para eliminar voces, separando la música de la voz.

ComfyUI-MMAudio — Nodo ComfyUI para el procesamiento de audio con el modelo MMAudio

Auralis — Motor de texto a voz (TTS) rápido

SongCleaner — Tecnología de IA para eliminar lenguaje inapropiado de las canciones.

Suno v4 — Plataforma de creación musical que ofrece audio y composición de letras de alta calidad.

Aplicación Moises — Herramienta de separación de audio AI para músicos

Mikrotakt — Utiliza tecnología de IA avanzada para extraer voces, acompañamientos y otros audios de canciones o videos.

AI Voice Lab — Convierte texto en voz realista en línea

OuteTTS-0.1-350M — Modelo de síntesis de texto a voz (TTS) basado en un modelo de lenguaje puro.

hertz-dev — Modelo base de generación de audio full-dúplex de código abierto

Fish Agent V0.1 3B — Modelo de voz a voz que captura y genera información de audio ambiental con alta precisión

Kit de IA para Navegador — Caja de herramientas de IA que se ejecuta directamente en el navegador

Universal-2 — IA de voz de próxima generación que ofrece una capacidad excepcional de procesamiento de datos de audio.

Cartesia Convertidor de Voz — Tecnología de cambio de voz de audio que transforma el sonido mientras conserva la expresión y emoción originales.

Separador de Voces de EaseUS — Utiliza tecnología de IA para separar la voz y la música de fondo de archivos de audio o video.

DiariZen — Un conjunto de herramientas para la segmentación de hablantes

AILIBRI — Un completo directorio de herramientas de redes neuronales de IA

Lista de Herramientas de IA — Directorio completo de herramientas de IA: descubre y utiliza las mejores herramientas de inteligencia artificial.

EzAudio — Modelo de texto a audio de alta calidad y generación eficiente.

Seed-Music — Sistema de generación musical que admite la generación de voces multilingües y la edición musical.

seed-vc — Tecnología de conversión de voz de muestra cero, que logra una conversión de alta fidelidad de la calidad y el timbre del sonido.

Kit de Voz Fácil — Caja de herramientas de IA de voz de implementación local que admite el reconocimiento, la transcripción y la conversión de voz.