Valley 2.0
テキスト、画像、動画データを処理する能力を向上させた、マルチモーダル大規模言語モデルです。
一般製品その他マルチモーダル大規模言語モデル
Valleyは、バイトダンスが開発したマルチモーダル大規模言語モデル(MLLM)で、テキスト、画像、動画データを含む様々なタスクの処理を目的としています。内部のEコマースと短編動画のベンチマークテストにおいて最良の結果を達成し、他のオープンソースモデルを大きく上回りました。また、OpenCompassマルチモーダルモデル評価ランキングでも優れたパフォーマンスを示し、平均スコア67.40で、既知のオープンソースMLLM(<10B)の中で上位2位以内に入っています。