OmniAudio-2.6B
世界最速のエッジデバイス対応音声言語モデル
プレミアム新製品生産性音声処理エッジコンピューティング
OmniAudio-2.6Bは、26億パラメーターのマルチモーダルモデルであり、テキストと音声の入力をシームレスに処理できます。Gemma-2B、Whisper turbo、およびカスタム投影モジュールを組み合わせることで、従来のASRとLLMモデルを直列に接続する方法とは異なり、これらの機能を効率的なアーキテクチャに統合し、最小限の遅延とリソース消費を実現しています。これにより、スマートフォン、ノートパソコン、ロボットなどのエッジデバイスで安全かつ迅速に音声テキストを直接処理できます。
OmniAudio-2.6B 最新のトラフィック状況
月間総訪問数
34880
直帰率
40.83%
平均ページ/訪問
2.7
平均訪問時間
00:00:46