OmniAudio-2.6B

世界最速のエッジデバイス対応音声言語モデル

プレミアム新製品生産性音声処理エッジコンピューティング
OmniAudio-2.6Bは、26億パラメーターのマルチモーダルモデルであり、テキストと音声の入力をシームレスに処理できます。Gemma-2B、Whisper turbo、およびカスタム投影モジュールを組み合わせることで、従来のASRとLLMモデルを直列に接続する方法とは異なり、これらの機能を効率的なアーキテクチャに統合し、最小限の遅延とリソース消費を実現しています。これにより、スマートフォン、ノートパソコン、ロボットなどのエッジデバイスで安全かつ迅速に音声テキストを直接処理できます。
ウェブサイトを開く

OmniAudio-2.6B 最新のトラフィック状況

月間総訪問数

34880

直帰率

40.83%

平均ページ/訪問

2.7

平均訪問時間

00:00:46

OmniAudio-2.6B 訪問数の傾向

OmniAudio-2.6B 訪問地理的分布

OmniAudio-2.6B トラフィックソース

OmniAudio-2.6B 代替品