OmniAudio-2.6B
世界上最快的边缘部署音频语言模型
优质新品生产力音频处理边缘计算
OmniAudio-2.6B是一个2.6B参数的多模态模型,能够无缝处理文本和音频输入。该模型结合了Gemma-2B、Whisper turbo和一个自定义投影模块,与传统的将ASR和LLM模型串联的方法不同,它将这两种能力统一在一个高效的架构中,以最小的延迟和资源开销实现。这使得它能够安全、快速地在智能手机、笔记本电脑和机器人等边缘设备上直接处理音频文本。
OmniAudio-2.6B 最新流量情况
月总访问量
20815
跳出率
59.92%
平均页面访问数
2.2
平均访问时长
00:00:46