Conjunto de datos multimodal médico MedTrinity-25M: con 25 millones de imágenes médicas

AIbase基地

Publicado elNoticias de IA · 3 minutos de lectura · Aug 12, 2024

424

El equipo UCSC-VLAA ha lanzado oficialmente el conjunto de datos multimodal a gran escala "MedTrinity-25M". Este conjunto de datos contiene 25 millones de imágenes médicas con anotaciones detalladas. Se considera una innovación importante en el campo de la medicina, ya que cuenta con anotaciones de múltiples granularidades que ayudan a los investigadores a comprender y aplicar mejor los datos médicos para entrenar modelos multimodales a gran escala en medicina.

El proceso de construcción de MedTrinity-25M fue bastante complejo. El equipo realizó un cuidadoso procesamiento de datos, extrayendo información clave de diversas fuentes, integrando metadatos, generando títulos aproximados, localizando áreas de interés y recopilando conocimientos médicos relevantes. Lo más interesante es que utilizaron esta información y modelos lingüísticos de gran escala (MLLM) para generar descripciones detalladas. Este método no solo mejora la disponibilidad de los datos, sino que también abre nuevas vías para la investigación médica.

En cuanto al proceso de lanzamiento, cabe mencionar que el conjunto de datos de demostración de MedTrinity-25M ya estaba disponible en junio de 2024, mientras que el conjunto de datos completo se lanzó oficialmente el 21 de julio. Recientemente, el 7 de agosto, también publicaron el artículo científico correspondiente.

Además del conjunto de datos en sí, el equipo proporciona una serie de modelos preentrenados, como LLaVA-Med++, que muestran un excelente rendimiento en múltiples tareas médicas. Los investigadores pueden utilizar estas herramientas para mejorar sus proyectos y aumentar considerablemente la eficiencia de la investigación médica.

MedTrinity-25M ofrece un recurso invaluable para la comunidad médica. Esperamos que todos puedan aprovechar al máximo este conjunto de datos para impulsar el avance de la investigación médica.

Acceso al proyecto: https://top.aibase.com/tool/medtrinity-25m

Sistema de IA de última generación detecta con precisión los cambios en las imágenes médicas

En el ámbito de la medicina, el análisis de datos de imágenes siempre ha sido un proceso complejo y laborioso. Recientemente, investigadores del Colegio de Medicina Weill Cornell desarrollaron un nuevo sistema de inteligencia artificial llamado LILAC (Inferencia de Cambios de Imágenes Longitudinales basada en Aprendizaje), capaz de analizar y detectar de manera eficiente y precisa los cambios en las imágenes médicas a lo largo del tiempo. Esta investigación, publicada el 20 de febrero en la revista de la Academia Nacional de Ciencias de Estados Unidos (PNAS), muestra el amplio potencial de aplicación de LILAC en múltiples escenarios médicos. Los métodos tradicionales de análisis de imágenes médicas suelen requerir una gran cantidad de personalización y preprocesamiento.

¡Pequeño pero potente! Microsoft lanza el modelo pequeño LLaVA-Rad para generar informes radiológicos precisos

Recientemente, investigadores de Microsoft Research, en colaboración con las universidades de Washington, Stanford, Southern California, California Davis y California San Francisco, presentaron LLaVA-Rad, un nuevo modelo multimodal pequeño (SMM) diseñado para mejorar la eficiencia en la generación de informes radiológicos clínicos. El lanzamiento de este modelo no solo representa un gran avance en la tecnología de procesamiento de imágenes médicas, sino que también abre nuevas posibilidades para las aplicaciones clínicas de la radiología. En el campo de la biomedicina, la investigación basada en modelos básicos a gran escala ya está en marcha.

El modelo de IA BiMediX2 analiza y traduce imágenes médicas, con un rendimiento excepcional en árabe

Un estudio dirigido por investigadores de la Universidad Mohamed bin Zayed ha dado como resultado un modelo de inteligencia artificial llamado BiMediX2. Este sistema puede comprender e interpretar información en imágenes médicas, con análisis bilingüe en inglés y árabe, mostrando un rendimiento particularmente excelente con el árabe. BiMediX2 es el primer sistema de IA capaz de analizar y describir imágenes médicas en inglés y árabe. El sistema puede procesar una variedad de imágenes médicas, incluyendo radiografías, exploraciones de resonancia magnética y micrografías.

GE Healthcare crea el primer modelo de IRM corporal completo en 3D con AWS para un análisis de imágenes médicas más preciso

Las imágenes de IRM siempre han supuesto un gran desafío en el análisis de imágenes médicas debido a su complejidad y gran volumen de datos. Para entrenar modelos de lenguaje grandes (LLM) para el análisis de IRM, los desarrolladores han tenido que dividir las imágenes adquiridas en imágenes 2D. Si bien este enfoque es viable, limita la capacidad del modelo para analizar estructuras anatómicas complejas, especialmente en casos complejos como tumores cerebrales, enfermedades óseas o enfermedades cardiovasculares. Nota de la imagen: La imagen fue generada por IA, el proveedor de servicios de licencias de imágenes es Midjourney. Sin embargo, GE Healthcare en este año de...