MINT-1T

Um conjunto de dados multimodais com um trilhão de tokens e 3,4 bilhões de imagens.

Novo Produto PremiumCódigo AbertoMultimodalConjunto de Dados
O MINT-1T é um conjunto de dados multimodais de código aberto criado pela Salesforce AI, contendo um trilhão de tokens de texto e 3,4 bilhões de imagens, sendo 10 vezes maior que os conjuntos de dados abertos existentes. Ele inclui não apenas documentos HTML, mas também documentos PDF e artigos do ArXiv, enriquecendo a diversidade do conjunto de dados. A construção do conjunto de dados MINT-1T envolve várias etapas de coleta, processamento e filtragem de dados de diversas fontes, garantindo alta qualidade e diversidade.
Abrir Site

MINT-1T Situação do Tráfego Mais Recente

Total de Visitas Mensais

13655

Taxa de Rejeição

99.15%

Média de Páginas por Visita

1.0

Duração Média da Visita

00:00:00

MINT-1T Tendência de Visitas

MINT-1T Distribuição Geográfica das Visitas

Sem Dados de Distribuição Geográfica

MINT-1T Fontes de Tráfego

MINT-1T Alternativas