Jina Embeddings V2 Base
Englischsprachiges Text-Embedding-Modell
Normales ProduktProduktivitätText-EmbeddingBert
Jina Embeddings V2 Base ist ein englisches Text-Embedding-Modell, das Sequenzen mit einer Länge von bis zu 8192 Token unterstützt. Es basiert auf der Bert-Architektur (JinaBert) und nutzt eine symmetrische bidirektionale Variante mit ALiBi, um längere Sequenzen zu ermöglichen. Das Modell wurde auf dem C4-Datensatz vortrainiert und anschließend auf einem Datensatz von über 400 Millionen Satzpaaren und Negativbeispielen von Jina AI weitertrainiert. Es eignet sich für diverse Anwendungsfälle mit langen Dokumenten, darunter die Suche in langen Dokumenten, die Berechnung semantischer Textähnlichkeiten, die Text-Re-Ranking, Empfehlungssysteme, RAG und generativ-basierte Suche mittels LLMs. Das Modell verfügt über 137 Millionen Parameter und wird für die Inferenz auf einer einzelnen GPU empfohlen.
Jina Embeddings V2 Base Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44