MINT-1T
Un conjunto de datos multimodal con un billón de tokens y 3400 millones de imágenes.
Nuevo Producto PremiumCódigo AbiertoMultimodalConjunto de datos
MINT-1T es un conjunto de datos multimodal de código abierto creado por Salesforce AI, que contiene un billón de tokens de texto y 3400 millones de imágenes, diez veces mayor que los conjuntos de datos de código abierto existentes. No solo incluye documentos HTML, sino también documentos PDF y artículos de ArXiv, enriqueciendo la diversidad del conjunto de datos. La creación del conjunto de datos MINT-1T implica varios pasos de recopilación, procesamiento y filtrado de datos de diversas fuentes, lo que garantiza la alta calidad y diversidad de los datos.
MINT-1T Situación del tráfico más reciente
Total de visitas mensuales
13655
Tasa de rebote
99.15%
Páginas promedio por visita
1.0
Duración promedio de la visita
00:00:00
MINT-1T Tendencia de visitas
MINT-1T Distribución geográfica de las visitas
No hay datos de distribución geográfica disponibles