Cuidado con utilizar ChatGPT: su tasa de error alcanza el 83% en el ámbito médico

Carlos Zapatero Publicado el 04 de enero, 2024 • 17:00

ChatGPT se ha convertido en nuestro asistente preferido para llevar a cabo una gran cantidad de tareas. Sin embargo, todavía está lejos de ser importante en ciertas industrias: el ámbito médico, el mejor ejemplo de ello.

ChatGPT ha tenido una gran penetración y notoriedad en una gran cantidad de sectores: el marketing, el periodismo o el diseño son solamente algunos ejemplos. Sus aparentes buenos resultados invitan a querer utilizarlo en una gran cantidad de situaciones, traspasando cualquier frontera. Sin embargo, existen muchos campos en los que todavía queda un largo camino por recorrer, como es el caso del ámbito médico.

Un estudio llevado a cabo por parte de Jama Pediatrics, una revista médica especializada en todo el campo médico pediátrico, ha demostrado como la tasa de precisión de ChatGPT para diagnosticar casos pediátricos únicamente alcanza el 17%.

imagen de la app de ChatGPT

Mucho camino por recorrer

El estudio pone de valor la importancia que la experiencia clínica puede llegar a tener a la hora de evaluar los casos médicos relacionados con los niños. Si bien es cierto que, antes o después, ChatGPT debe integrarse en la atención clínica para ayudar en una gran cantidad de tareas de las que se encarga actualmente el equipo médico, la realidad es que todavía queda mucho camino por recorrer hasta que esta herramienta de Inteligencia Artificial pueda suponer una ayuda real ante esta situación.

En el mes de julio de 2023, la misma revista ya llevó a cabo un estudio similar. En este caso, para evaluar la precisión de la IA para realizar diagnósticos complejos y, en él, se demostró que su tasa de acierto alcanzaba el 39%. Muy por encima de los últimos resultados obtenidos.

Históricamente, la medicina siempre ha sido muy proactiva a recibir todo tipo de innovaciones que permitan reorientar los recursos disponibles para enfocar al personal médico en aquellas situaciones que realmente requieren la experiencia y conocimientos de los mismos. Anteriormente, ya se ha utilizado la IA para crear sesgos raciales o para interpretar exploraciones llevadas a cabo. Además de para la automatización de tareas administrativas, el principal uso de ChatGPT en la actualidad en este campo.

La especialización pediátrica

La diferencia en los resultados entre la medicina general y la especialización pediátrica tiene que ver con la cantidad de elementos que pueden interferir a la hora de llevar a cabo el correspondiente trabajo sobre los más pequeños. Puesto que es clave considerar la edad del paciente y, en base a la misma, es posible que el diagnóstico difiera entre sí. Más aún si tenemos en cuenta que muchos niños todavía no se encuentran en la edad para poder identificar o transmitir los síntomas que experimentan cuando sufren cualquier alteración en su organismo.

Una de las principales quejas del equipo médico que comprobó los resultados fue que ChatGPT no logró capturar completamente el diagnóstico. En muchos casos, los resultados eran demasiado amplios o inespecíficos para poder calificar el diagnóstico como si fuera correcto.

En los resultados finales, ChatGPT únicamente logró responder de manera correcta en 17 de los 100 casos estudiados. En 72 de ellos, el diagnóstico fue muy erróneo. Mientras que en los restantes 11, no fue todo lo preciso que debería.