Megrez-3B-Omni
端側全モダリティ理解オープンソースモデル
一般製品生産性全モダリティ理解画像認識
Megrez-3B-Omniは、無問芯穹によって開発された端側全モダリティ理解モデルです。大規模言語モデルMegrez-3B-Instructを拡張したもので、画像、テキスト、音声の3種類のモダリティデータの理解と分析能力を備えています。このモデルは、画像理解、言語理解、音声理解のすべてにおいて最高の精度を達成し、中国語と英語の音声入力と複数回の対話をサポートしています。音声指示に従ってテキストで直接応答し、画像への音声での質問にも対応可能です。複数のベンチマークタスクで最先端の結果を達成しています。
Megrez-3B-Omni 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44