MINT-1T

Un conjunto de datos multimodal con un billón de tokens y 3400 millones de imágenes.

Nuevo Producto PremiumCódigo AbiertoMultimodalConjunto de datos
MINT-1T es un conjunto de datos multimodal de código abierto creado por Salesforce AI, que contiene un billón de tokens de texto y 3400 millones de imágenes, diez veces mayor que los conjuntos de datos de código abierto existentes. No solo incluye documentos HTML, sino también documentos PDF y artículos de ArXiv, enriqueciendo la diversidad del conjunto de datos. La creación del conjunto de datos MINT-1T implica varios pasos de recopilación, procesamiento y filtrado de datos de diversas fuentes, lo que garantiza la alta calidad y diversidad de los datos.
Abrir sitio web

MINT-1T Situación del tráfico más reciente

Total de visitas mensuales

13655

Tasa de rebote

99.15%

Páginas promedio por visita

1.0

Duración promedio de la visita

00:00:00

MINT-1T Tendencia de visitas

MINT-1T Distribución geográfica de las visitas

No hay datos de distribución geográfica disponibles

MINT-1T Fuentes de tráfico

MINT-1T Alternativas