SUS-Chat-34B: Ein neues, großes Sprachmodell

Die Southern University of Science and Technology (SUSTech) hat in Zusammenarbeit mit dem IDEA Forschungsinstitut und dem CCNL Zentrum ein neues, großes Sprachmodell namens SUS-Chat-34B mit 34 Milliarden Parametern veröffentlicht. Dieses Modell zeigt hervorragende Leistungen in chinesischen und englischen Aufgaben und übertrifft andere Modelle mit vergleichbarer Parameteranzahl.

SUS-Chat-34B basiert auf dem Yi-34B vortrainierten Modell und wurde mit Millionen von hochwertigen, mehrsprachigen Anweisungsdaten feinabgestimmt. Das Modell zeichnet sich durch umfangreiche, komplexe Anweisungsdaten, starke allgemeine Leistungsfähigkeit, ein längeres Kontextfenster und eine hervorragende Fähigkeit zu mehrstufigen Dialogen aus.