Se cuestiona la capacidad de diagnóstico médico de ChatGPT: un estudio revela una tasa de error de hasta el 50%

AIbase基地

Publicado elNoticias de IA · 5 minutos de lectura · Aug 19, 2024

332

A pesar de los impresionantes avances de la inteligencia artificial (IA) en el ámbito médico, un nuevo estudio revela importantes deficiencias en la IA generalista, como ChatGPT, en el diagnóstico médico complejo.

Un equipo de investigación dirigido por el educador médico Amrit Kirpalani de la Universidad Western de Ontario, Canadá, descubrió que ChatGPT cometió errores en 76 de 150 casos médicos complejos de Medscape, con una tasa de error superior al 50%.

El estudio utilizó la base de datos de preguntas de Medscape, cuyos casos son más realistas que los del Examen de Licencia Médica de los Estados Unidos (USMLE), incluyendo múltiples complicaciones y desafíos diagnósticos. El equipo de investigación eludió inteligentemente la prohibición de OpenAI sobre el uso de ChatGPT para consejos médicos mediante un diseño ingenioso de las indicaciones.

IA médica (2)

Nota de la fuente: La imagen fue generada por IA, proveedor de servicios de licencias de imágenes Midjourney

Kirpalani señala que el bajo rendimiento de ChatGPT se debe principalmente a dos factores: en primer lugar, a diferencia de la IA médica especializada, ChatGPT carece de un profundo conocimiento especializado en medicina; en segundo lugar, ChatGPT tiene dificultades para manejar las "zonas grises" de la medicina, sin la capacidad de interpretar resultados de exámenes ligeramente anormales con la flexibilidad de un médico humano.

Más preocupante aún es que, incluso cuando proporciona diagnósticos erróneos, ChatGPT puede ofrecer explicaciones que parecen razonables y convincentes. Esta característica podría inducir a error a los no profesionales, aumentando el riesgo de propagación de información errónea.

A pesar de ello, la IA sigue teniendo valor en el ámbito médico. El coautor del estudio, Edward Tran, afirma que ChatGPT se ha convertido en una herramienta importante en la educación médica, ayudando a los estudiantes a organizar sus notas, aclarar algoritmos de diagnóstico y prepararse para los exámenes. Sin embargo, Kirpalani recomienda encarecidamente al público que no utilice ChatGPT para buscar consejo médico y que siga consultando a profesionales de la salud.

Kirpalani considera que la creación de médicos de IA fiables requiere un entrenamiento con grandes cantidades de datos clínicos y una supervisión rigurosa. A corto plazo, es más probable que la IA se utilice para mejorar el trabajo de los médicos humanos que para sustituirlos por completo. Con el avance de la tecnología, la aplicación de la IA en el ámbito médico seguirá siendo un tema digno de atención.

Se lanza CardioMind, el primer modelo AI cardiovascular de China, para mejorar la inteligencia del diagnóstico médico

Recientemente, el Hospital Zhongshan afiliado a la Universidad de Fudan y el Instituto de Inteligencia Científica de Shanghai lanzaron conjuntamente CardioMind (观心), el primer modelo de IA especializado en cardiología de China. Esta innovadora tecnología marca el comienzo de una nueva era en el diagnóstico inteligente de enfermedades cardiovasculares. El modelo, denominado "AI cardiólogo", tiene como objetivo imitar el razonamiento de los mejores expertos para mejorar la eficiencia del diagnóstico y tratamiento de las enfermedades cardiovasculares. El académico de la Academia de Ciencias de China y director de cardiología, Junbo Ge, declaró en la presentación que el modelo CardioMind no se limita a introducir datos en la IA.

Estudio revela que o1-preview de OpenAI supera a los médicos en el diagnóstico de casos médicos complejos

Un nuevo estudio sugiere que el sistema de inteligencia artificial o1-preview de OpenAI podría superar a los médicos humanos en el diagnóstico de casos médicos complejos. Un equipo de investigación de la Facultad de Medicina de Harvard y la Universidad de Stanford realizó una prueba exhaustiva de diagnóstico médico de o1-preview, mostrando una mejora significativa con respecto a las versiones anteriores. Según los hallazgos, o1-preview logró una precisión de diagnóstico del 78.3% en todos los casos probados. En una comparación directa de 70 casos específicos, el sistema

Nuevo estudio revela que ChatGPT ofrece ayuda limitada en el diagnóstico médico

Cuerpo del texto: En los últimos años, la aplicación de la inteligencia artificial (IA) en el ámbito médico ha recibido una atención creciente. En particular, muchos hospitales esperan que los chatbots como ChatGPT sirvan como herramientas auxiliares para mejorar la eficiencia del diagnóstico médico. Sin embargo, un estudio reciente publicado en la revista 《JAMA Network Open》 muestra que el uso de ChatGPT no ha mejorado significativamente la capacidad de diagnóstico de los médicos. Este estudio revela el potencial y las limitaciones de la IA en el diagnóstico médico. Nota sobre la imagen: Imagen generada por IA

Modelo o1 completo de OpenAI revelado: capacidades superiores, procesamiento de 200.000 tokens

Recientemente, un usuario en la plataforma de redes sociales X reveló que el nuevo modelo o1 de OpenAI proporcionó acceso a algunos usuarios durante un breve período a través de la URL "chatgpt.com/?model=o1", acceso que posteriormente se cerró rápidamente. Según los comentarios de los usuarios, este último modelo puede procesar aproximadamente 200.000 palabras de texto y tiene la capacidad de analizar imágenes. OpenAI califica el modelo o1 como su "modelo más potente", especialmente adecuado para tareas que requieren creatividad y razonamiento de alto nivel.