Valley

テキスト、画像、動画データを処理するマルチモーダル大規模言語モデル

一般製品画像マルチモーダル大規模言語モデル
Valleyは、バイトダンスが開発した最先端のマルチモーダル大規模言語モデルであり、テキスト、画像、動画データを含む様々なタスクを処理できます。内部のECサイトと短編動画のベンチマークテストで最良の結果を達成し、他のオープンソースモデルを上回っています。OpenCompassテストでは、同規模のモデルと比較して平均スコアが67.40以上であり、10B未満のモデルの中では2位にランクインしています。Valley-EagleバージョンはEagleを参考に、トークンの数を柔軟に調整し、元のビジュアルトークンと並列で動作するビジュアルエンコーダを導入することで、極端な状況でのモデル性能を向上させています。
ウェブサイトを開く

Valley 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

Valley 訪問数の傾向

Valley 訪問地理的分布

Valley トラフィックソース

Valley 代替品