WeST
Transcription vocale basée sur un LLM, implémentée en 300 lignes de code.
Produit OrdinaireProgrammationReconnaissance vocaleTraitement du langage naturel
WeST est un modèle open source de transcription vocale qui convertit la parole en texte grâce à un grand modèle linguistique (LLM), le tout en seulement 300 lignes de code. Il se compose d'un grand modèle linguistique, d'un encodeur vocal et d'un projecteur ; seule la partie du projecteur est entraînable. Inspiré de SLAM-ASR et LLaMA 3.1, WeST vise à fournir une solution efficace de reconnaissance vocale via un code simplifié.
WeST Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34