A pesar de los impresionantes avances de la inteligencia artificial (IA) en el ámbito médico, un nuevo estudio revela importantes deficiencias en la IA generalista, como ChatGPT, en el diagnóstico médico complejo.

Un equipo de investigación dirigido por el educador médico Amrit Kirpalani de la Universidad Western de Ontario, Canadá, descubrió que ChatGPT cometió errores en 76 de 150 casos médicos complejos de Medscape, con una tasa de error superior al 50%.

El estudio utilizó la base de datos de preguntas de Medscape, cuyos casos son más realistas que los del Examen de Licencia Médica de los Estados Unidos (USMLE), incluyendo múltiples complicaciones y desafíos diagnósticos. El equipo de investigación eludió inteligentemente la prohibición de OpenAI sobre el uso de ChatGPT para consejos médicos mediante un diseño ingenioso de las indicaciones.

IA médica (2)

Nota de la fuente: La imagen fue generada por IA, proveedor de servicios de licencias de imágenes Midjourney

Kirpalani señala que el bajo rendimiento de ChatGPT se debe principalmente a dos factores: en primer lugar, a diferencia de la IA médica especializada, ChatGPT carece de un profundo conocimiento especializado en medicina; en segundo lugar, ChatGPT tiene dificultades para manejar las "zonas grises" de la medicina, sin la capacidad de interpretar resultados de exámenes ligeramente anormales con la flexibilidad de un médico humano.

Más preocupante aún es que, incluso cuando proporciona diagnósticos erróneos, ChatGPT puede ofrecer explicaciones que parecen razonables y convincentes. Esta característica podría inducir a error a los no profesionales, aumentando el riesgo de propagación de información errónea.

A pesar de ello, la IA sigue teniendo valor en el ámbito médico. El coautor del estudio, Edward Tran, afirma que ChatGPT se ha convertido en una herramienta importante en la educación médica, ayudando a los estudiantes a organizar sus notas, aclarar algoritmos de diagnóstico y prepararse para los exámenes. Sin embargo, Kirpalani recomienda encarecidamente al público que no utilice ChatGPT para buscar consejo médico y que siga consultando a profesionales de la salud.

Kirpalani considera que la creación de médicos de IA fiables requiere un entrenamiento con grandes cantidades de datos clínicos y una supervisión rigurosa. A corto plazo, es más probable que la IA se utilice para mejorar el trabajo de los médicos humanos que para sustituirlos por completo. Con el avance de la tecnología, la aplicación de la IA en el ámbito médico seguirá siendo un tema digno de atención.