LLaVA-o1

段階的推論が可能な視覚言語モデル

一般製品生産性視覚言語モデル段階的推論
LLaVA-o1は、北京大学元組チームが開発した視覚言語モデルです。GPT-o1と同様に、自発的で体系的な推論を実行できます。Gemini-1.5-pro、GPT-4o-mini、Llama-3.2-90B-Vision-Instructなど、6つの難易度が高いマルチモーダルベンチマークテストにおいて、他のモデルを凌駕する成果を上げています。LLaVA-o1は段階的推論によって問題を解決し、視覚言語モデルにおける独自の強みを示しています。
ウェブサイトを開く

LLaVA-o1 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

LLaVA-o1 訪問数の傾向

LLaVA-o1 訪問地理的分布

LLaVA-o1 トラフィックソース

LLaVA-o1 代替品