Jina Embeddings V2 Base

英語テキスト埋め込みモデル

一般製品生産性テキスト埋め込みBert

Jina Embeddings V2 Baseは、最大8192トークンのシーケンス長に対応した英語テキスト埋め込みモデルです。JinaBertをベースとしたBertアーキテクチャを採用し、より長いシーケンス長を可能にするALiBiによる対称的な双方向変種を使用しています。C4データセットで事前学習された後、Jina AIが保有する4億個を超える文のペアとネガティブサンプルの集合を用いてさらに学習されています。長文書処理の様々なユースケース、例えば長文書検索、意味的テキスト類似度計算、テキストの再ランキング、レコメンド、RAG、LLMベースの生成検索などに適しています。パラメーター数は1億3700万個で、単一GPUでの推論が推奨されます。

Best AI Websites & Tools

Jina Embeddings V2 Base

Jina Embeddings V2 Base 最新のトラフィック状況

Jina Embeddings V2 Base 訪問数の傾向

Jina Embeddings V2 Base 訪問地理的分布

Jina Embeddings V2 Base トラフィックソース

Jina Embeddings V2 Base 代替品

Jina Embeddings V2 Base — 英語テキスト埋め込みモデル

Gemini Embedding テキスト埋め込みモデル — Gemini Embeddingは、Gemini APIを通じて強力な言語理解能力を提供する、高度なテキスト埋め込みモデルです。

ModernBERT — ModernBERTは、卓越した性能を誇る次世代エンコーダーモデルです。

intfloat/e5-mistral-7b-instruct — 大規模言語モデルを用いたテキスト埋め込みの改良

NeoBase — NeoBaseは、自然言語でデータベースとやり取りできるオープンソースのAIデータベースアシスタントです。

Instella — Instellaは、AMDが開発した高性能なオープンソース言語モデルであり、オープンソース言語モデルの発展を加速するために設計されています。

クローン — クローンは、革命的な人工筋肉技術Myofiberを搭載したヒューマノイドロボットで、自然な歩行が可能です。

ViDoRAG — ViDoRAGは、視覚ドキュメント検索を強化した生成のための動的イテレーティブ推論エージェントフレームワークです。

Microsoft Dragon Copilot — Microsoft Dragon Copilotは医療業界向けのAIワークスペースであり、臨床文書ワークフローを簡素化し、効率性を向上させます。

Migician — Migicianは、複数の画像の配置に特化した多モーダル大規模言語モデルであり、自由形式の複数の画像の精密配置を実現できます。

IndexTTS — 産業レベルで制御可能な、効率的なゼロショットテキスト音声変換システム

olmOCR — olmOCRは、LLMデータセットのトレーニングに使用するためにPDFを線形化するツールキットです。

Raycast AI Extensions — Raycastは、自然言語コマンドを使用してコンピューター上のアプリケーションと対話し、タスクを実行するAI Extensionsを発表しました。

MLGym — MLGymは、AI研究エージェントの発展を促進するための新しいフレームワークとベンチマークです。

TableGPT-agent — TableGPT2をベースとした、表データに基づく質疑応答タスクのための事前構築済みエージェントです。

bRAG-langchain — Retrieval-Augmented Generation (RAG) アプリケーション構築のためのオープンソースプロジェクトです。

Qwen — Qwen Chatは、最先端の言語モデルをベースとしたAIチャットツールです。スマートな会話と多様な機能を提供します。

FlexHeadFA — 高速かつメモリ効率の高い正確なアテンションメカニズム

FlashMLA — FlashMLAはHopper GPU向けに最適化された、高効率なMLAデコードカーネルです。可変長シーケンスサービスに適しています。

VLM-R1 — VLM-R1は、安定性と汎用性に優れた強化学習に基づくビジュアル言語モデルであり、画像理解タスクに特化しています。

Moonlight-16B-A3B — Moonlight-16B-A3Bは、Muon最適化器を用いてトレーニングされた160億パラメータの混合専門家モデルであり、効率的な言語生成を目的としています。

Moonlight — Moonlightは、Muon最適化器を用いて訓練された160億パラメータの混合専門家モデルで、優れた性能を誇ります。

kg-gen — あらゆるテキストから知識グラフを抽出するAIツールです。

Kie.ai — Kie.aiは、DeepSeek R1およびV3 APIを統合し、安全で拡張性の高いAIソリューションを提供します。

幻覚リーダーボード — 大型言語モデルが短い文書を要約する際に生じる幻覚を比較するためのランキングです。

KET-RAG — KET-RAGは、知識グラフを統合した検索強化型生成フレームワークであり、効率的なドキュメント索引と回答生成に使用されます。

Proxy — Proxyは、日常業務を自動化する全自動AIアシスタントです。

DeepSeekモデル互換性チェック — デバイスが様々な規模のDeepSeekモデルを実行できるかどうかを検出し、互換性を予測します。

循環型事前学習モデル — 4096個のAMD GPU上で動作する大規模深層循環言語モデルの事前学習コードです。

コンシェルジュAI — 自然言語でアプリケーションとインタラクトし、業務効率と利便性を向上させます。