Jina Embeddings V2 Base
英語テキスト埋め込みモデル
一般製品生産性テキスト埋め込みBert
Jina Embeddings V2 Baseは、最大8192トークンのシーケンス長に対応した英語テキスト埋め込みモデルです。JinaBertをベースとしたBertアーキテクチャを採用し、より長いシーケンス長を可能にするALiBiによる対称的な双方向変種を使用しています。C4データセットで事前学習された後、Jina AIが保有する4億個を超える文のペアとネガティブサンプルの集合を用いてさらに学習されています。長文書処理の様々なユースケース、例えば長文書検索、意味的テキスト類似度計算、テキストの再ランキング、レコメンド、RAG、LLMベースの生成検索などに適しています。パラメーター数は1億3700万個で、単一GPUでの推論が推奨されます。
Jina Embeddings V2 Base 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44