La integración de inteligencia artificial (IA) en la práctica clínica continúa avanzando, aunque la evidencia reciente subraya importantes limitaciones para su uso autónomo por pacientes. Un estudio liderado por la Universidad Estatal de Pensilvania, difundido entre el 6 y el 8 de junio de 2026, evaluó el desempeño de chatbots impulsados ​​por IA en la respuesta a consultas médicas cotidianas, evidenciando una precisión aproximada del 76%.

El análisis incluyó 212 preguntas relacionadas con problemas de salud reales e hipotéticos, generadas por 34 participantes, utilizando distintos sistemas de IA (ChatGPT, Gemini y Llama, entre otros). Las respuestas fueron posteriormente evaluadas por nueve médicos certificados, quienes analizaron tanto su exactitud clínica como el potencial daño asociado.

El estudio pone de manifiesto una tasa de error superior al 20%, lo que implica que más de una de cada cinco respuestas podría ser incorrecta o potencialmente dañina. Este hallazgo resulta especialmente crítico en áreas como neurología, dermatología y medicina interna, donde la precisión fue menor y el riesgo clínico mayor.

Desde la perspectiva clínica, estos resultados refuerzan el papel de la IA como herramienta complementaria más que sustitutiva. Los sistemas mostraron mejor desempeño cuando se interpretaron en contextos profesionales, lo que sugiere que su valor reside en el soporte a la toma de decisiones médicas, optimización de flujos de trabajo y acceso a información, pero siempre bajo supervisión experta.

La creciente utilización de IA por parte de pacientes como fuente primaria de orientación sanitaria plantea retos en términos de seguridad, alfabetización digital y regulación. En este sentido, los autores subrayan la necesidad de desarrollar marcos normativos y estrategias educativas que permitan integrar estas tecnologías de forma segura en la práctica clínica.

En conclusión, aunque la IA demuestra un potencial significativo para transformar la atención médica, su implementación debe ser cautelosa, basada en evidencia y centrada en el médico como eje del proceso diagnóstico y terapéutico.

Referencias:
1. Penn State University. Calling Doctor GPT: AI responses to healthcare queries are nearly 76% accurate [Internet]. University Park (PA): Penn State; 2026 May 28 [cited 2026 Jun 8]. Disponible en: https://www.psu.edu/news/research/story/calling-doctor-gpt-ai-responses-healthcare-queries-are-nearly-76-accurate