vdr-2b-multi-v1
Mehrsprachiges Einbettungsmodell für die visuelle Dokumentensuche.
Normales ProduktBildMehrsprachigVisuelle Dokumentensuche
vdr-2b-multi-v1 ist ein von Hugging Face entwickeltes mehrsprachiges Einbettungsmodell, das speziell für die visuelle Dokumentensuche konzipiert wurde. Das Modell kodiert Screenshots von Dokumentenseiten als dichte Ein-Vektor-Darstellungen, wodurch die Suche und Abfrage von visuell reichhaltigen Dokumenten in mehreren Sprachen ohne OCR- oder Datenextraktionsprozess möglich ist. Es basiert auf MrLight/dse-qwen2-2b-mrl-v1 und wurde mit einem selbst erstellten mehrsprachigen Query-Bild-Datensatz trainiert. Als verbesserte Version von mcdse-2b-v1 bietet es eine höhere Leistung. Das Modell unterstützt Italienisch, Spanisch, Englisch, Französisch und Deutsch und verfügt über einen Open-Source-Datensatz mit 500.000 hochwertigen Beispielen für ein mehrsprachiges synthetisches Training. Es zeichnet sich durch niedrigen VRAM-Verbrauch und schnelle Inferenz aus und liefert hervorragende Ergebnisse bei der sprachübergreifenden Suche.
vdr-2b-multi-v1 Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44