MINT-1T

Ein multimodaler Datensatz mit einer Billion Token und 3,4 Milliarden Bildern.

Premium-NeuproduktOpen SourceMultimodalDatensatz
MINT-1T ist ein von Salesforce AI als Open Source veröffentlichter multimodaler Datensatz, der eine Billion Text-Token und 3,4 Milliarden Bilder umfasst – das Zehnfache der Größe bestehender Open-Source-Datensätze. Er enthält nicht nur HTML-Dokumente, sondern auch PDF-Dokumente und ArXiv-Paper, was die Diversität des Datensatzes bereichert. Die Erstellung des MINT-1T-Datensatzes umfasste mehrere Schritte zur Datenerfassung, -verarbeitung und -filterung aus verschiedenen Quellen, um eine hohe Qualität und Diversität der Daten sicherzustellen.
Website öffnen

MINT-1T Neueste Verkehrssituation

Monatliche Gesamtbesuche

13655

Absprungrate

99.15%

Durchschnittliche Seiten pro Besuch

1.0

Durchschnittliche Besuchsdauer

00:00:00

MINT-1T Besuchstrend

MINT-1T Geografische Verteilung der Besuche

Keine geografischen Verteilungsdaten verfügbar

MINT-1T Traffic-Quellen

MINT-1T Alternativen