InternLM-XComposer-2.5

多機能大型視覚言語モデル

プレミアム新製品生産性視覚言語モデル長文コンテキスト処理
InternLM-XComposer-2.5は、長文コンテキストの入出力に対応した多機能大型視覚言語モデルです。様々なテキスト・画像の理解と創作アプリケーションにおいて優れた性能を発揮し、GPT-4Vと同等のレベルに達していますが、7BのLLMバックエンドのみを使用しています。24Kのインターリーブされた画像テキストコンテキストで学習されており、RoPE外挿により96Kの長文コンテキストにシームレスに拡張できます。この長文コンテキスト能力により、広範な入力と出力コンテキストを必要とするタスクで特に優れた性能を発揮します。さらに、超高解像度画像理解、細粒度ビデオ理解、複数回にわたる複数画像の対話、Webサイト作成、高品質な画像付き記事の作成などもサポートしています。
ウェブサイトを開く

InternLM-XComposer-2.5 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

InternLM-XComposer-2.5 訪問数の傾向

InternLM-XComposer-2.5 訪問地理的分布

InternLM-XComposer-2.5 トラフィックソース

InternLM-XComposer-2.5 代替品