Das Shanghai Artificial Intelligence Laboratory gab bekannt, dass sein großes Sprachmodell „Shusheng“ ein wichtiges Versions-Upgrade erhalten hat und „Shusheng · Puyu 3.0“ (InternLM3) vorgestellt wurde. Laut Labor wurde durch einen verfeinerten Datenrahmen die Effizienz der Datennutzung deutlich gesteigert, was zu einer höheren Denkfähigkeit geführt hat.

image.png

Das InternLM3-8B-Instruct Modell der aktuellen Version wurde lediglich mit 4 TB Daten trainiert. Das Labor gibt an, dass seine Gesamtleistung Open-Source-Modelle gleicher Größe übertrifft und die Trainingskosten um über 75 % reduziert wurden. Bemerkenswert ist, dass diese Version erstmals die Integration von konventionellen Dialog- und Tiefenreflexionsfähigkeiten in einem Universalmodell erreicht hat und somit besser auf diverse reale Anwendungsszenarien reagieren kann.

Für die Modellbewertung verwendete das Forschungsteam den Open-Source-Bewertungsrahmen „Sinan OpenCompass“ und eine einheitliche, reproduzierbare Methode. Die Bewertung umfasste über zehn anerkannte Bewertungssätze wie CMMLU und GPQA und berücksichtigte verschiedene Dimensionen wie Schlussfolgerung, Mathematik, Programmierung, Anweisungsbefolgung, die Generierung langer Texte, Dialog und die Gesamtleistung. Die Ergebnisse zeigen, dass „Shusheng · Puyu 3.0“ in den meisten Bewertungssätzen führend abschneidet und seine Gesamtleistung GPT-4-mini sehr nahe kommt.

Das Shanghai AI Labor betont außerdem, dass dieses neue Modell das erste Universal-Dialogmodell in der Open-Source-Community ist, das die Browser-Nutzung unterstützt und mehr als 20 Webseiten-Navigationsschritte ermöglicht, um so eine tiefgehende Informationsgewinnung zu erreichen.

Testseite: https://internlm-chat.intern-ai.org.cn.

Wichtigste Punkte:

🌟 Das Shusheng · Puyu 3.0 Modell wurde mit 4 TB Daten trainiert, übertrifft Open-Source-Modelle gleicher Größe in der Gesamtleistung und reduziert die Trainingskosten um über 75 %.

📊 Das Modell erzielt in mehreren anerkannten Bewertungssätzen führende Ergebnisse, wobei die Integration von Denk- und Dialogfähigkeiten die Leistung deutlich verbessert.

🌐 Das neue Modell unterstützt die Browser-Nutzung und ermöglicht die tiefgehende Informationsgewinnung, was es zu einem Highlight der Open-Source-Community macht.