Valley 2.0

テキスト、画像、動画データを処理する能力を向上させた、マルチモーダル大規模言語モデルです。

一般製品その他マルチモーダル大規模言語モデル
Valleyは、バイトダンスが開発したマルチモーダル大規模言語モデル(MLLM)で、テキスト、画像、動画データを含む様々なタスクの処理を目的としています。内部のEコマースと短編動画のベンチマークテストにおいて最良の結果を達成し、他のオープンソースモデルを大きく上回りました。また、OpenCompassマルチモーダルモデル評価ランキングでも優れたパフォーマンスを示し、平均スコア67.40で、既知のオープンソースMLLM(<10B)の中で上位2位以内に入っています。
ウェブサイトを開く

Valley 2.0 代替品