Mistral AI hat kürzlich sein neuestes großes Sprachmodell, Mistral Large 2, vorgestellt. Dieses Modell erzielt bemerkenswerte Fortschritte in Bezug auf Wirtschaftlichkeit, Geschwindigkeit und Leistung.

Modellübersicht

Mistral Large 2 ist ein Modell mit 123 Milliarden Parametern und einem Kontextfenster von 128K. Es unterstützt Dutzende von Sprachen, darunter Englisch, Französisch, Deutsch, Spanisch, Italienisch, Portugiesisch, Arabisch, Hindi, Russisch, Chinesisch, Japanisch und Koreanisch, sowie über 80 Programmiersprachen wie Python, Java, C, C++, JavaScript und Bash.

Leistungshighlights

QQ_1721867063415.png

Allgemeine Leistung: In MMLU-Tests erreichte die vortrainierte Version von Mistral Large 2 eine Genauigkeit von 84,0 %.

QQ_1721867086970.png

QQ_1721867110778.png

Code- und Inferenzfähigkeit: In Bezug auf Codegenerierung und mathematisches Schlussfolgern liefert Mistral Large 2 vergleichbare Ergebnisse wie führende Modelle wie GPT-4, Claude 3 Opus und Llama 3 405B.

QQ_1721867130761.png

Mehrsprachigkeit: In mehrsprachigen MMLU-Benchmarks zeigt Mistral Large 2 eine hervorragende mehrsprachige Verarbeitungsfähigkeit, insbesondere in wichtigen Sprachen wie Englisch, Französisch und Deutsch.

Anweisungsbefolgung und Ausrichtung: In Benchmarks wie MT-Bench, Wild Bench und Arena Hard verbessert Mistral Large 2 die Anweisungsbefolgung und die Dialogfähigkeit deutlich.

Tool-Nutzung und Funktionsaufrufe: Das Modell wurde trainiert, um parallele und sequentielle Funktionsaufrufe effizient auszuführen und bietet so eine starke Unterstützung für komplexe Geschäftsanwendungen.

Technische Eigenschaften

Signifikante Reduzierung von „Halluzinationen“, wodurch die Zuverlässigkeit und Genauigkeit der Ausgaben verbessert werden.

Verbessertes Selbstverständnis des Modells, wenn keine Lösung gefunden werden kann oder Informationen fehlen.

Fokus auf die Generierung prägnanter und zielgerichteter Antworten, um die Interaktionseffizienz und Wirtschaftlichkeit zu steigern.

Anwendung und Verfügbarkeit

Mistral Large 2 ist jetzt auf la Plateforme unter dem Namen „mistral-large-2407“ verfügbar.

Die Modellgewichte wurden freigegeben und werden auf Hugging Face gehostet.

Mistral AI erweitert die Zusammenarbeit mit Google Cloud Platform und bietet über Vertex AI Managed API-Services an.

Das Modell ist auch über Cloud-Service-Anbieter wie Azure AI Studio, Amazon Bedrock und IBM watsonx.ai zugänglich.

Lizenz und Nutzungsbedingungen

Mistral Large 2 wird unter der Mistral Research License veröffentlicht und darf für Forschungs- und nichtkommerzielle Zwecke verwendet werden. Für kommerzielle Zwecke ist eine Mistral Commercial License erforderlich.

Die Veröffentlichung dieses neuen Modells markiert einen bedeutenden Fortschritt von Mistral AI im Bereich der großen Sprachmodelle und bietet Entwicklern von KI-Anwendungen leistungsfähigere und flexiblere Tools, die Innovationen in verschiedenen Branchen vorantreiben können.