WeST

300行代码实现基于LLM的语音转录。

普通产品编程语音识别自然语言处理
WeST是一个开源的语音识别转录模型,以300行代码的简洁形式,基于大型语言模型(LLM)实现语音到文本的转换。它由一个大型语言模型、一个语音编码器和一个投影器组成,其中仅投影器部分可训练。WeST的开发灵感来源于SLAM-ASR和LLaMA 3.1,旨在通过简化的代码实现高效的语音识别功能。
打开网站

WeST 最新流量情况

月总访问量

499904316

跳出率

37.31%

平均页面访问数

5.8

平均访问时长

00:06:52

WeST 访问量趋势

WeST 访问地理位置分布

WeST 流量来源

WeST 替代品