MedTrinity-25M es un conjunto de datos multimodales a gran escala que incluye anotaciones médicas de granularidad múltiple. Desarrollado colaborativamente por múltiples autores, está diseñado para impulsar la investigación en el campo del procesamiento de imágenes y texto médicos. La construcción del conjunto de datos incluye pasos como la extracción de datos y la generación de descripciones de texto de granularidad múltiple, y admite diversas tareas de análisis de imágenes médicas, como preguntas y respuestas visuales (VQA) y análisis de imágenes patológicas.