Shen Dou, Executive Vice President der Baidu Group, gab heute auf der Baidu Cloud Intelligence Conference 2024 das Upgrade der Baidu Baige Computing Platform 4.0 bekannt. Diese neue Version unterstützt Multi-Chip-Hybrid-Training und Multi-Chip-Anpassung und erreicht auf einem Cluster mit zehntausenden von Karten eine effektive Trainingsdauer von über 99,5 %, wodurch die Effizienz der Rechenleistung deutlich gesteigert wird.
Vor dem Hintergrund des aktuellen Mangels an Rechenleistung wird das Upgrade von Baige 4.0 Unternehmen helfen, Rechenressourcen effizienter zu nutzen und die Betriebskosten zu senken. Der Schwerpunkt des Upgrades liegt auf der Verbesserung der „Multi-Chip-Hybrid-Training“-Fähigkeit, wodurch auf einem Cluster mit zehntausenden von Karten eine Trainingsleistung von 95 % erreicht wird, was branchenführend ist.
Darüber hinaus ermöglicht Baige 4.0 eine sekundenschnelle Bereitstellung und verkürzt die Vorbereitungszeit für den Betrieb eines Clusters mit zehntausenden von Karten von mehreren Wochen auf nur eine Stunde. Dies steigert die Bereitstellungseffizienz erheblich und verkürzt die Zeit bis zur Inbetriebnahme. Um die häufig auftretenden Fehler während des Trainings großer Modelle zu beheben, wurde Baige 4.0 um verbesserte Fehlererkennungsmethoden und automatische Fehlertoleranzmechanismen erweitert. Dies reduziert die Fehlerhäufigkeit und die Fehlerbehebungszeit effektiv und gewährleistet eine effektive Trainingsdauer von über 99,5 %.
Im Bereich des Modell-Inferenz wurde Baige 4.0 hinsichtlich Geschwindigkeit und Kosten optimiert, insbesondere bei der Inferenz langer Texte, wobei die Effizienz um mehr als das Doppelte gesteigert wurde, um die wachsende Marktnachfrage zu erfüllen.