WeST

Transcription vocale basée sur un LLM, implémentée en 300 lignes de code.

Produit OrdinaireProgrammationReconnaissance vocaleTraitement du langage naturel
WeST est un modèle open source de transcription vocale qui convertit la parole en texte grâce à un grand modèle linguistique (LLM), le tout en seulement 300 lignes de code. Il se compose d'un grand modèle linguistique, d'un encodeur vocal et d'un projecteur ; seule la partie du projecteur est entraînable. Inspiré de SLAM-ASR et LLaMA 3.1, WeST vise à fournir une solution efficace de reconnaissance vocale via un code simplifié.
Ouvrir le site Web

WeST Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

WeST Tendance des visites

WeST Distribution géographique des visites

WeST Sources de trafic

WeST Alternatives