WeST

300行代码实现基于LLM的语音转录。

普通产品编程语音识别自然语言处理
WeST是一个开源的语音识别转录模型,以300行代码的简洁形式,基于大型语言模型(LLM)实现语音到文本的转换。它由一个大型语言模型、一个语音编码器和一个投影器组成,其中仅投影器部分可训练。WeST的开发灵感来源于SLAM-ASR和LLaMA 3.1,旨在通过简化的代码实现高效的语音识别功能。
打开网站

WeST 最新流量情况

月总访问量

494758773

跳出率

37.69%

平均页面访问数

5.7

平均访问时长

00:06:29

WeST 访问量趋势

WeST 访问地理位置分布

WeST 流量来源

WeST 替代品