MedTrinity-25M é um conjunto de dados multimodais em larga escala que contém anotações médicas de múltiplos grãos. Desenvolvido colaborativamente por diversos autores, visa impulsionar a pesquisa nas áreas de processamento de imagens e texto médicos. A construção do conjunto de dados inclui etapas como extração de dados e geração de descrições de texto multigranulares, suportando várias tarefas de análise de imagens médicas, como perguntas e respostas visuais (VQA) e análise de imagens patológicas.