MINT-1T
Ein multimodaler Datensatz mit einer Billion Token und 3,4 Milliarden Bildern.
Premium-NeuproduktOpen SourceMultimodalDatensatz
MINT-1T ist ein von Salesforce AI als Open Source veröffentlichter multimodaler Datensatz, der eine Billion Text-Token und 3,4 Milliarden Bilder umfasst – das Zehnfache der Größe bestehender Open-Source-Datensätze. Er enthält nicht nur HTML-Dokumente, sondern auch PDF-Dokumente und ArXiv-Paper, was die Diversität des Datensatzes bereichert. Die Erstellung des MINT-1T-Datensatzes umfasste mehrere Schritte zur Datenerfassung, -verarbeitung und -filterung aus verschiedenen Quellen, um eine hohe Qualität und Diversität der Daten sicherzustellen.
MINT-1T Neueste Verkehrssituation
Monatliche Gesamtbesuche
13655
Absprungrate
99.15%
Durchschnittliche Seiten pro Besuch
1.0
Durchschnittliche Besuchsdauer
00:00:00
MINT-1T Besuchstrend
MINT-1T Geografische Verteilung der Besuche
Keine geografischen Verteilungsdaten verfügbar