SALUD & TECH: La IA aprueba en diagnósticos finales, pero "reprueba" en razonamiento clínico inicial - LA NACION INFORMA

“Conectando, Informando, Avanzando"

LO MAS RECIENETE

jueves, 16 de abril de 2026

SALUD & TECH: La IA aprueba en diagnósticos finales, pero "reprueba" en razonamiento clínico inicial

 


REDACCIÓN CIENCIA.- LA NACIÓN INFORMA Jueves, 16 de abril de 2026

BOSTON, MA – Un estudio exhaustivo realizado por la incubadora de innovación MESH, perteneciente a la prestigiosa red de hospitales Mass General Brigham, ha puesto a prueba la capacidad médica de la inteligencia artificial. La conclusión es clara: aunque la IA puede ser un excelente asistente, todavía no está lista para diagnosticar pacientes sin la supervisión constante de un médico.

El Desafío del "Diagnóstico Diferencial"

Los investigadores evaluaron 21 de los modelos más avanzados del mundo, incluidos GPT-5, Grok 4 y Gemini, utilizando una nueva métrica llamada PrIME-LLM. Los resultados mostraron una brecha importante en el desempeño:

  • Éxito en el Final: Cuando la IA dispone de todos los datos (laboratorios, exámenes físicos, etc.), acierta el diagnóstico final en más del 90% de los casos.

  • Falla en el Inicio: El problema surge al principio. En más del 80% de los casos, los modelos fallaron al intentar crear un "diagnóstico diferencial" (la lista de posibles enfermedades) cuando la información es escasa o abierta.

  • Si quieres saber más sobre el entrenamiento militar de nuestros soldados en El Salvador, haz clic aquí: 🔗 Noticia Anterior: Militares dominicanos en ejercicio CENTAM Guardian

La IA como Aumento, No Reemplazo

"La IA no puede replicar actualmente el arte de la medicina", subrayó el Dr. Marc Succi, director de MESH. El estudio destaca que, en situaciones donde los datos no están completos —algo común en la práctica médica real—, la IA tiende a perder el rumbo.

El Ranking de los Modelos

El estudio también funcionó como un barómetro de la industria. En la escala de competencia clínica:

  1. Líderes: Grok 4 y GPT-5 obtuvieron las mejores puntuaciones con un 78%.

  2. Otros modelos: Gemini 1.5 Flash se situó en un 64%.

El equipo de investigadores, que incluye a estudiantes de la Facultad de Medicina de Harvard, concluyó que si bien los modelos más nuevos superan consistentemente a los anteriores, su función actual debe ser la de aumentar la capacidad del médico, no reemplazarla.


🖋️ SOBRE ESTE ARTÍCULO

Director Editorial: Gustavo Serrata

Redacción: La Nación Informa

Contacto: lanacionimforma1@gmail.com

“Conectando, Informando, Avanzando.”

 

No hay comentarios:

Publicar un comentario