Valley
テキスト、画像、動画データを処理するマルチモーダル大規模言語モデル
一般製品画像マルチモーダル大規模言語モデル
Valleyは、バイトダンスが開発した最先端のマルチモーダル大規模言語モデルであり、テキスト、画像、動画データを含む様々なタスクを処理できます。内部のECサイトと短編動画のベンチマークテストで最良の結果を達成し、他のオープンソースモデルを上回っています。OpenCompassテストでは、同規模のモデルと比較して平均スコアが67.40以上であり、10B未満のモデルの中では2位にランクインしています。Valley-EagleバージョンはEagleを参考に、トークンの数を柔軟に調整し、元のビジュアルトークンと並列で動作するビジュアルエンコーダを導入することで、極端な状況でのモデル性能を向上させています。
Valley 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34