Das Zhiyuan-Institut hat kürzlich drei neue Vektormodelle veröffentlicht, die in Vektorsuch-Aufgaben hervorragende Leistungen zeigen und mehrere Benchmark-Bestwerte verbessert haben. Diese drei Modelle sind:

  1. BGE-EN-ICL: Ein englisches Vektormodell, das durch die Einführung von aufgabenbezogenen Query-Dokument-Beispielen als wenige Beispiele die semantische Ausdrucksfähigkeit des Modells verbessert.

  2. BGE-Multilingual-Gemma2: Ein mehrsprachiges Vektormodell, das hervorragende Leistungen zeigt, insbesondere bei der Verbesserung der Fähigkeiten in Chinesisch und Englisch.

  3. BGE-Reranker-v2.5-Gemma2-Lightweight: Ein mehrsprachiges Re-Ranking-Modell, das durch optimiertes Design schichtweise frühe Ausgaben und Token-Komprimierung unterstützt und so Rechenressourcen spart.

Diese Modelle basieren auf großen Sprachmodellen und verfügen über eine hervorragende Domänenanpassungsfähigkeit und breite Generalisierungsleistung. Sie nutzen auch kontextuelles Lernen und Destillationstechniken, um die Gesamtperformance und die Fähigkeiten in Suchaufgaben zu verbessern. Das Modell BGE-Reranker-v2.5-Gemma2-Lightweight legt besonderen Wert auf ein leichtgewichtiges Design, um bei gleichbleibend hoher Leistung effizienter zu sein.

In den experimentellen Ergebnissen zeigten diese Modelle in mehreren Benchmark-Tests wie MTEB, BEIR und AIR-Bench hervorragende Leistungen. BGE-Multilingual-Gemma2 zeichnet sich durch seine mehrsprachigen Fähigkeiten aus, insbesondere bei der Verbesserung der Fähigkeiten in Chinesisch und Englisch. BGE-EN-ICL zeigt besonders hervorragende Leistungen im Few-Shot-Bereich. BGE-Reranker-v2.5-Gemma2-Lightweight erreicht auch bei Re-Ranking-Aufgaben bessere Ergebnisse und gewährleistet bei Einsparung von Rechenressourcen eine überragende Leistung.

Modell-Links

(1) BGE-EN-ICL: 

https://huggingface.co/BAAI/bge-en-icl

(2) BGE-Multilingual-Gemma2: 

https://huggingface.co/BAAI/bge-multilingual-gemma2

(3) BGE-Reranker-v2.5-Gemma2-Lightweight: 

https://huggingface.co/BAAI/bge-reranker-v2.5-gemma2-lightweight