hertz-dev
オープンソースの全二重音声生成基礎モデル
一般製品プログラミング音声処理音声認識
hertz-devは、Standard Intelligenceがオープンソースで提供する全二重、音声のみのトランスフォーマーベースモデルで、85億パラメーターを備えています。このモデルは拡張可能なクロスモーダル学習技術を表しており、モノラル16kHzの音声を8Hzの潜在表現に変換でき、ビットレートは1kbpsです。他のオーディオコーデックよりも優れた性能を発揮します。hertz-devの主な利点には、低遅延、高効率、研究者による微調整と構築の容易さなどがあります。製品の背景情報として、Standard Intelligenceは全人類に利益をもたらす汎用人工知能の構築を目指しており、hertz-devはその取り組みの第一歩です。
hertz-dev 最新のトラフィック状況
月間総訪問数
2897
直帰率
81.20%
平均ページ/訪問
1.4
平均訪問時間
00:00:25