LLaVA++
LLaVAモデルを拡張し、Phi-3とLLaMA-3を統合することで、視覚と言語モデル間のインタラクション能力を向上させました。
一般製品プログラミング人工知能自然言語処理
LLaVA++は、Phi-3とLLaMA-3モデルを統合することでLLaVAモデルの視覚能力を拡張することを目的としたオープンソースプロジェクトです。Mohamed bin Zayed University of AI (MBZUAI)の研究者によって開発され、最新の巨大言語モデルを組み合わせることで、指示への遵守や学術的なタスク指向データセットにおけるモデルのパフォーマンスを強化しています。
LLaVA++ 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34