SALMONN

SALMONN : Réseau neuronal ouvert pour la langue, l'audio, la voix et la musique

Produit OrdinaireProductivitéVoixAudio

SALMONN est un grand modèle linguistique (LLM) développé par le département d'ingénierie électronique de l'université Tsinghua et ByteDance. Il prend en charge les entrées vocales, les événements audio et musicaux. Contrairement aux modèles ne prenant en charge que les entrées vocales ou les événements audio, SALMONN peut percevoir et comprendre divers types d'entrées audio, ce qui lui confère des capacités innovantes telles que la reconnaissance et la traduction vocales multilingues, ainsi que le raisonnement conjoint audio-vocal. Cela peut être considéré comme l'attribution d'une « audition » et d'une capacité de cognition auditive à un LLM, faisant de SALMONN une étape vers une intelligence artificielle générale dotée de capacités auditives.

Actualités IA

IA Quotidien

Chronologie de l'IA

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

SALMONN

SALMONN Dernière situation du trafic

SALMONN Tendance des visites

SALMONN Distribution géographique des visites

SALMONN Sources de trafic

SALMONN Alternatives

SALMONN — SALMONN : Réseau neuronal ouvert pour la langue, l'audio, la voix et la musique

Speaking AI — IA de génération vocale pour conversations naturelles

Orate — Orate est une boîte à outils d'IA axée sur la voix, prenant en charge la synthèse vocale (TTS) et la reconnaissance vocale (STT).

Maidio — Maidio est une application intelligente qui transforme le contenu des actualités RSS en podcasts conversationnels grâce à l'IA.

Radio Maiyoo — Radio Maiyoo utilise l'IA pour transformer les actualités en bulletins d'informations sous forme de dialogue, offrant ainsi une expérience radio personnalisée.

Hailuo — Votre assistant IA intelligent ultime.

MiniCPM-o — MiniCPM-o 2.6 : un MLLM (Modèle Linguistique Multimodal) de niveau GPT-4o, capable de réaliser des diffusions en direct visuelles, vocales et multimodales sur un téléphone portable.

PodRedit — Plateforme de partage de podcasts, découvrez les émissions de podcasts populaires.

PodSnap.AI — Générateur de résumés de podcasts par IA, ne manquez plus aucun moment clé.

Outspeed — Plateforme IA de vidéo et de voix en temps réel

Daily Bots — Plateforme cloud open source offrant une IA vocale et vidéo à très faible latence.

EchoMimic — Technologie de pointe pour la génération de vidéos de portraits dynamiques réalistes.

GG Rewriter — Mettre la puissance de l'intelligence artificielle au service d'une rédaction plus efficace et plus rapide.

Pipecat — Framework open source pour la création d'IA conversationnelles vocales et multimodales.

Journi — Partagez vos voyages avec le monde entier.

LangAI — Apprenez plusieurs langues en discutant avec une IA

Butter Reader — Transformez vos articles de blog en audio captivant.

ChatGPT RTL — Permet à ChatGPT de prendre en charge le texte de droite à gauche

Ad Auris — Écoutez vos articles où et quand vous voulez

SpeechGPT — Modèle linguistique multimodal

Konch — Service de transcription automatique rapide et précise

FreGrad — Codeur vocal diffusé léger et rapide sensible à la fréquence

Unified-IO 2 — Modèle génératif multi-modal unifié

Jellypod — Transformez votre boîte de réception en podcast quotidien personnalisé.

Plateforme API Merlin — Intégration rapide des LLM dans les applications de production

Huddles — De conversations informelles aux réunions de collaboration approfondie, Huddles offre un nouveau moyen léger de connexion audio ou vidéo, accessible partout et à tout moment.

Read — Read génère pour les utilisateurs un bulletin audio quotidien personnalisé de nouvelles.

Talk to GPT — Communiquez avec ChatGPT par la voix

GlossAi — Réutilisation complète des vidéos et des audios

Sous-titres IA YouTube / Traducteur Web - Trancy — Sous-titres bilingues IA pour YouTube et Netflix, et traduction IA ChatGPT sur le Web.