ALMA-13B-R
Erweitertes maschinelles Übersetzungsmodell
Normales ProduktProduktivitätMaschinelle ÜbersetzungModell-Feinabstimmung
Das ALMA-R-Modell wurde durch Contrastive Preference Optimization (CPO) weiter verfeinert (LoRA-Feinabstimmung) und übertrifft GPT-4 und WMT-Preisträger. Das ALMA(-R)-Modell und die Datensätze stehen im GitHub-Repository zum Download bereit. ALMA-R baut auf dem ALMA-Modell auf und verwendet im Gegensatz zum Supervised Fine-tuning von ALMA unsere Contrastive Preference Optimization (CPO) zur Feinabstimmung. Die CPO-Feinabstimmung erfordert unsere Triplet-Präferenzdaten für das Präferenzlernen. ALMA-R erreicht jetzt die Leistung von GPT-4 und WMT-Preisträgern oder übertrifft diese sogar!
ALMA-13B-R Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44