hertz-dev

オープンソースの全二重音声生成基礎モデル

一般製品プログラミング音声処理音声認識
hertz-devは、Standard Intelligenceがオープンソースで提供する全二重、音声のみのトランスフォーマーベースモデルで、85億パラメーターを備えています。このモデルは拡張可能なクロスモーダル学習技術を表しており、モノラル16kHzの音声を8Hzの潜在表現に変換でき、ビットレートは1kbpsです。他のオーディオコーデックよりも優れた性能を発揮します。hertz-devの主な利点には、低遅延、高効率、研究者による微調整と構築の容易さなどがあります。製品の背景情報として、Standard Intelligenceは全人類に利益をもたらす汎用人工知能の構築を目指しており、hertz-devはその取り組みの第一歩です。
ウェブサイトを開く

hertz-dev 最新のトラフィック状況

月間総訪問数

2897

直帰率

81.20%

平均ページ/訪問

1.4

平均訪問時間

00:00:25

hertz-dev 訪問数の傾向

hertz-dev 訪問地理的分布

hertz-dev トラフィックソース

hertz-dev 代替品