Skywork-MoE-Base
Hochleistungsfähiges Mixed-Expert-Modell mit 146 Milliarden Parametern
Normales ProduktProgrammierungMixed-Expert-ModellGroßskalig (viele Parameter)
Skywork-MoE-Base ist ein hochleistungsfähiges Mixed-Expert-(MoE-)Modell mit 146 Milliarden Parametern, bestehend aus 16 Experten und 22 Milliarden aktivierten Parametern. Das Modell wurde von einem dichten Checkpoint des Skywork-13B-Modells initialisiert und beinhaltet zwei innovative Technologien: eine Gate-Logik-Normalisierung zur Verbesserung der Expertendynamik und einen adaptiven Hilfsverlustkoeffizienten, der eine schichtenweise Anpassung des Hilfsverlustkoeffizienten ermöglicht. Skywork-MoE zeigt in verschiedenen gängigen Benchmark-Tests eine vergleichbare oder überlegene Leistung im Vergleich zu Modellen mit mehr Parametern oder aktivierten Parametern.
Skywork-MoE-Base Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44