null Inteligencia artificial en el programa de cribado de cáncer de mama
Informes de Evaluación de Tecnologías Sanitarias
24/06/2025

Carlos Baldó Sierra

Radiólogo. Unidad de Patología mamaria. Hospital Universitario de Cabueñes

En el mes de mayo de 2024, el Servicio de Evaluación de Tecnologías Sanitarias del Gobierno Vasco (OSTEBA) publicó el informe de evaluación “Inteligencia artificial en el programa de detección de cáncer de mama” a petición de la Dirección General de Salud Pública y Equidad en la Salud ante la necesidad de disponer de evidencia científica sobre la eficacia clínica, coste/efectividad e impacto presupuestario de la utilización de SIA en los Programas de Detección Precoz de cáncer de mama con el objeto de asesorar en la toma de decisiones sobre la posible incorporación de dichos sistemas en la cartera común básica del SNS.

Son innumerables las referencias bibliográficas que reflejan la importancia del cáncer de mama en el mundo actual, no sólo por su elevada incidencia y tasa de mortalidad, sino porque además afecta en gran medida a mujeres en un periodo de su vida con gran implicación laboral, social y familiar.

Los Programas de Detección Precoz (PDP) de cribado poblacional mediante estudios mamográficos periódicos, iniciados hace varios lustros, han demostrado definitivamente que son capaces por sí mismos, e independientemente del progreso de los tratamientos, de reducir la tasa de mortalidad por este tumor entre la población participante[1].

Aún así desde los inicios de la implementación de estos Programas como estrategia de Salud Pública en los diferentes Sistemas sanitarios han sido, y siguen siendo, muchas las controversias que continúan suscitando: falsos positivos, falsos negativos, sobrediagnóstico, sobretratamiento, ansiedad, radiación, coste, periodicidad, edad de realización, adecuación al riesgo personal… Curiosamente, en este sentido y como con frecuencia ocurre en nuestra sociedad, uno de los mayores debates surgió tras la publicación en un medio de comunicación, el New York Times en el año 2001, de una reseña de un artículo científico de la prestigiosa revista Lancet[2] en la que se concluía que no había evidencia científica del beneficio de la mamografía y que por lo tanto no estaba justificado.

Superadas alguna de estas, digamos, viejas controversias van surgiendo nuevos retos: la ampliación de la horquilla de edad de la población diana, la incorporación de nuevas técnicas mamográficas como la tomosíntesis, que multiplica exponencialmente el número de imágenes a valorar por el radiólogo, la realización de programas que consideran los factores de riesgo de cada mujer, definir qué tumores diagnosticados son relevantes y cuáles no, etc. Como consecuencia de todo ello se está asistiendo a un aumento progresivo y significativo, no sólo del coste sino también de la carga de trabajo en los Servicios de Radiología, potenciado a su vez por el insuficiente número de especialistas en radiología en la mayoría de ellos y la falta de residentes graduados disponibles para cubrir vacantes laborales, configurando una nueva “amenaza” sobre la continuidad y desarrollo de estos PDP.

La llegada de la mamografía digitalizada permitió a partir de los años 90 la implementación de Sistemas de Detección Asistida por Ordenador (CAD) como una herramienta de apoyo al diagnóstico en mamografía e importantes expectativas para reducir la carga de trabajo de los radiólogos y mejorar la precisión en el diagnóstico. Estos sistemas emplean técnicas clásicas de aprendizaje automático con características que el sistema debía detectar, como la forma, tamaño, densidad, etc., y que se predefinían manualmente. Útil pero limitado por la necesidad de esa ingeniería manual de características y la incapacidad de aprender y adaptarse con el tiempo. Su uso ha decaído en la actualidad por su baja especificidad con un alto porcentaje de falsos positivos y negativos, pero ha abierto la puerta a desarrollos recientes en el campo de la Inteligencia Artificial: la capacidad de las máquinas para realizar tareas intelectuales habitualmente realizadas por humanos, o como mejor define la ley-IA-UE (Ley de la Inteligencia Artificial de la U. Europea) aprobada el 14 de Junio de 2023: sistema basado en máquinas diseñado para funcionar con diversos niveles de autonomía y capaz, para objetivos explícitos e implícitos, de generar información de salida – como predicciones, recomendaciones o decisiones – que influya en entornos reales o virtuales[3].

Estos sistemas de inteligencia artificial (SIA) difieren fundamentalmente del CAD tradicional al aprender automáticamente las características relevantes de los datos sin una definición ni programación explícitas.

En la actualidad hay un interés creciente en el uso de SIA en los programas de cribado basados en arquitecturas de redes neuronales convolucionales de aprendizaje profundo empleados como herramientas de apoyo a la detección y diagnóstico radiológico así como para la clasificación y notificación radiológica. Se plantean como una solución a los retos y controversias mencionadas de estos Programas, pudiendo mejorar la detección, reducir los casos de intervalo, reducir la carga de trabajo e incluso mejorar la ratio coste/beneficio.

El desarrollo de SIA en los PDP de cáncer de mama está siendo dirigido fundamentalmente a un uso: 

  • Como instrumento de apoyo al especialista en radiología en la detección, proporcionando, además de marcas en regiones sospechosas de la mamografía, un soporte interactivo o una puntuación a todo el examen indicativa del grado de sospecha de cáncer de mama. 
  • Como lector independiente o autónomo para sustituir algunos de los especialistas en radiología por su capacidad de categorizar las mamografías según su probabilidad de contener cáncer, pudiendo evitar la doble lectura en los exámenes considerados por el SIA como normales.
  • Como herramienta de clasificación previa al cribado por la que el SIA podría descartar para la lectura por los radiólogos los casos considerados de bajo riesgo y priorizaría los de alto riesgo.
  • Para la reducción de la carga de trabajo, consecuencia de los apartados anteriores.

En este Informe de Evaluación de Tecnología se valoran tres aspectos fundamentales respecto a la implementación de la IA en los PDP de cáncer de mama:

1.- Una primera parte tiene el objetivo de evaluar la eficacia clínica (precisión en la detección) y la eficiencia (coste/efectividad) de integrar los SIA a los PDP.

Para ello realiza una revisión sistemática de la evidencia científica en la que finalmente se incluyeron 1 revisión sistemática (Ref. 5 del informe), 11 estudios individuales sobre eficacia clínica (Ref. 21-31 del informe) y 1 estudio de coste/efectividad (Ref. 44 del informe).

La evidencia analizada sugiere que los SIA son más precisos cuando se emplean en la fase del proceso de cribado como ayuda a la lectura única al asistir al especialista en radiología en la interpretación y proporcionar otra evaluación de la misma, así como herramienta de clasificación previa al cribado eliminando de la lectura por el radiólogo todos los casos normales evidentes, es decir, los de bajo riesgo, que no requieren más revisión, y un cribado posterior del resto de los casos.

Coincide con otras tres revisiones (5, 8 y 57 del Informe) cuando los SIA se utilizan como sistema autónomo en sustitución de los radiólogos, las estimaciones puntuales de la precisión de los SIA fueron inferiores o dispares a las obtenidas por consenso de dos especialistas en radiología en la práctica de cribado.

La estrategia más coste efectiva, medida por los Años de Vida Ganados ajustados por Calidad (AVAC), es la de realizar una mamografía a todas las mujeres entre 40-49 años interpretada mediante IA como sistema de clasificación del riesgo, cribando sólo y anualmente a las de alto riesgo hasta los 49 años. Posteriormente y hasta los 74 años control mamográfico bienal si no tienen antecedentes familiares y anualmente a las que los tengan. (Incluye costes de predicción de riesgo, coste de cribado y coste de tratamiento con datos del año 2020 en EEUU).

2.- En una segunda parte se realiza un Análisis del coste que se prevé al realizar un PDP mediante un SIA utilizado como apoyo a la detección en el cribado mamográfico con el fin de clasificar las mamografías para lectura por un solo radiólogo (si el SIA las considera de bajo riesgo) o por dos radiólogos (si el SIA las considera de alto riesgo) en comparación con la doble lectura estándar actual de todas las mamografías. Se toma como referencia principal el ensayo MASAI (Ref. 64 del informe). 

Este estudio demostró que el SIA puede considerarse seguro, al ser la tasa de cáncer detectado en el cribado similar a la obtenida con la lectura doble, sin aumentar la tasa de revaloraciones, los falsos positivos ni las reuniones de consenso.

El Informe de Evaluación plantea como objetivo conocer el coste de esta estrategia de cribado. Para ello considera los siguientes datos:

  • Coste por estudio mamográfico realizado con estrategia de cribado mediante un sistema de IA: 0,82 vs 4,82 $ (Consejería Sanidad de la Junta de Galicia-Transpara 1.7.4 vs sistema IA Mia del estudio ref. 70)
  • Coste por estudio mamográfico leído por radiólogo considerando la retribución anual según la Dirección General del Servicio Vasco de Salud: 6,39 $
  • Número de horas de trabajo asistencial anual del radiólogo: 1.365 h.
  • Tiempo empleado por el radiólogo en la lectura e informe de una mamografía de cribado con tomosíntesis según la edición 16 de la SERAM: 7 min.
  • Cohorte valorada: 50.000 mujeres
  • Escala de predicción de riesgo de malignidad del SIA: 1-7 riesgo bajo, 8-9 riego intermedio, 10 riesgo alto.
  • Sólo se computan los gastos directos de la realización de la mamografía.

Como resultado del análisis se produciría una reducción en el número de lecturas de mamografías por el radiólogo (carga de trabajo) entre 27,41% al 44,3% y un coste incremental (negativo) desde –53.524,62 $ hasta -253.384 $ dependiendo si se realiza doble lectura a las mamografías consideradas por la IA como de riesgo medio y alto (puntuación del SIA de 8-10) o sólo a las de alto riesgo (puntuación del SIA de 10) respectivamente.

El principal factor que influye en la reducción del coste es el motivado por el precio de la lectura mamográfica mediante SIA, dato que depende en gran medida de cómo se negocie con las empresas proveedoras. Si este fuese > 5,89 $ o si la carga de trabajo no se llegase a reducir >6,2%, el gasto sanitario sería entonces menor utilizando la estrategia de la doble lectura convencional frente a la estrategia de cribado con IA.

3.- Una tercera, y muy interesante, última parte aborda las implicaciones éticas, legales y sociales que conlleva la incorporación de la IA no sólo en los PDP de cáncer de mama sino en la práctica clínica general. 

Aspectos relacionados con la privacidad de los datos y la ciberseguridad, con la responsabilidad de las decisiones, la confianza en el sistema de IA, el nivel de equidad y justicia de estos sistemas, entre otros son tratados a pesar del aún escaso recorrido de la IA en la práctica clínica y los vacíos que existen en muchos de estos aspectos.

Este extenso y, a mi parecer, didáctico Informe ha hecho el esfuerzo de reunir en sus páginas el papel potencial que la utilización de los SIA podría tener en los PDP de cribado de cáncer de mama. Se ha basado en una rigurosa revisión sistemática de la evidencia científica existente hasta Julio del año 2022, donde analiza más estudios y un mayor conjunto de datos que los incluidos en tres importantes RS realizadas con anterioridad con el mismo objetivo (Ref. 5, 8, 57 del informe). Además es relevante el que sólo se incluyeran en este informe estudios en los que los SIA analizados hubieran sido validados externamente con datos de diferentes centros y países.

Coincido con los autores en las limitaciones que tiene el informe por valorar únicamente estudios publicados en inglés, sesgos en los SIA seleccionados, heterogeneidad en la metodología, disparidad en los umbrales de positividad, seguimiento de menos de 2 años en algunos estudios, entre otros. Añadiría el haber, todavía, pocos estudios sobre los que basarse para tomar decisiones argumentadas. El haber incluido en este Informe una sola revisión sistemática de 336 revisiones identificadas, sólo 11 estudios sobre eficacia clínica de 2.232 estudios identificados y un único estudio sobre análisis de costes, da idea de la dificultad.

Por otro lado son estudios individuales sobre eficacia clínica, no sobre efectividad, es decir, en condiciones de “laboratorio” en lugar de práctica clínica habitual, de carácter retrospectivo y con muestras, en su mayoría, pequeñas y en muchos casos enriquecidas con SIA entrenados con datos específicos a una población o contexto concreto, que podría hacer que los resultados obtenidos no puedan ser extrapolables a la clínica diaria u otras realidades sanitarias.

Es precisa la realización de más estudios prospectivos, ensayos controlados aleatorizados y con seguimiento clínico suficiente que posibilite evaluar cambios potenciales en el balance beneficio/daño. En este sentido son reseñables los resultados obtenidos en el estudio alemán PRAIM[4], de carácter prospectivo sobre 461.818 mujeres, que evaluó la implementación de un SIA, como herramienta de clasificación previa al cribado en los PDP mostrando una tasa de detección un 17,6% más alta en el grupo valorado con el apoyo de los SIA y una reducción de un 2,5% la tasa de revaloración en comparación con el modelo estándar (doble lectura sin apoyo de SIA) y todo ello con un aumento del 9% en el VPP de la biopsia.

La carga de trabajo sobre los radiólogos (doble lectura en ambos grupos) que tenían apoyo del SIA redujo casi a la mitad (un 43%) el tiempo preciso para la valoración de las mamografías que el SIA había considerado como “normales”.

El PDP de cáncer de mama que se realiza en el Principado de Asturias no es ajeno a estos planteamientos. Iniciados en el año 1992 con una mamografía analógica en una sola proyección de cada mama y una población diana de mujeres con edades comprendidas entre los 50 y 64 años se ha pasado, siguiendo las directrices de las Guías europeas, a doble proyección de cada mama y una población diana de edades comprendidas entre los 50 y 74 años (y pronto …. veremos incluir las mujeres de 45 a 49 años). 

Si bien la digitalización de la mamografía supuso una reducción del tiempo en el proceso de lectura por la rapidez de manejo y acceso a las imágenes, en una mayoría de las Unidades de Detección se realiza la mamografía con tomosíntesis, técnica presumiblemente más precisa pero que multiplica el número de imágenes a valorar por 80 (de 4 a 300 imágenes aproximadamente).

Este elevado aumento de la carga de trabajo corre paralelo a la sobrecarga que en general sufren los Servicios de Radiología, no sólo en Asturias y en España, como consecuencia del aumento exponencial del número de pruebas y técnicas radiológicas que se realizan y la escasez de profesionales que estos Servicios tienen.

La aplicación a nuestro ámbito de las conclusiones del Informe referidas en el análisis de costes está en gran medida limitado por el hecho de que este informe plantea el coste de la utilización de SIA en PDP con una estrategia de cribado de doble lectura y con una tasa de valoración del 0,2%. En este sentido nuestro PDP está generalizada la lectura única y tenemos porcentajes de revaloración significativamente mayores. No analiza, como así reconocen en el Informe, el coste que supondría la utilización del SIA como herramienta de clasificación previa al cribado en los que el SIA elimina todos los casos normales evidentes, es decir los de bajo riesgo. En esta estrategia se supone que el análisis del coste sería incluso más favorable al suponerse una mayor reducción en la carga de trabajo que la obtenida en la estrategia analizada.

Además, los costes de las pruebas y de los diferentes estadios de salud se obtuvieron de bases de datos de precios y tarifas de EEUU y de la literatura. Así mismo, al no conocerse el coste de la utilización del SIA para la predicción del riesgo de cáncer de mama en la práctica clínica tuvieron que estimarlo basándose en datos publicados por la Sociedad Europea de Radiología.

Estos datos, unido a otras consideraciones (retribución del radiólogo, convenios singulares con otros Centros, diversidad en las diferentes Unidades de cribado, etc.), hacen difícilmente extrapolable estos costes a nuestro PDP. 

En cambio la evidencia documentada en el Informe sobre el empleo de la IA como herramienta de clasificación previa al cribado y como instrumento de ayuda al radiólogo sí podría apoyar la implementación de sistemas de IA entrenados en estos dos aspectos, pudiendo reducir la carga de trabajo y a su vez mejorar la tasa de detección sin que ello suponga un aumento de la tasa de revaloraciones.

Otra limitación, a mi parecer importante, de este estudio es que una mayoría de los estudios y revisiones analizadas en el Informe utilizan como prueba de cribado la mamografía digital sin tomosíntesis (excepto en el estudio de coste), mientras que la técnica prácticamente generalizada en nuestro PDP es la mamografía digital con tomosíntesis. En este sentido mencionar el excelente trabajo publicado en Radiology de un grupo de PDP de Córdoba (recogido en este Informe ref. 28) donde concluye que el empleo de los SIA como lector autónomo podría reemplazar al radiólogo en la interpretación de las mamografías digitales (sin tomosíntesis) al lograr una sensibilidad no inferior en comparación con la lectura única, pero no podría hacerlo en la interpretación de mamografías con tomosíntesis sin aumentar notablemente la tasa de valoración.

 

El SIA que más incidiría en la reducción de la carga de trabajo de nuestros radiólogos y Servicios de Radiología, y por lo tanto directamente en los costes, sería el que pudiese ser empleado como sistema autónomo para sustituir, en algunos casos, al especialista en radiología actuando como herramienta de clasificación previa excluyente. Esto supondría que un elevado porcentaje de estudios (hasta el 90%) podrían ser considerados negativos para malignidad, normales, únicamente por el SIA aplicado sin que tuviesen que ser valorados por el radiólogo.

Esto, hoy por hoy, no es posible. La ley-IA-UE considera a los SIA utilizados en el proceso radiológico como de Alto Riesgo y no contempla que estos SIA puedan ser autónomos. Por tanto, la no supervisión por parte del radiólogo sería una conducta ilegal[5]. Aún así son muchos los estudios (y entre ellos el PRAIM) que ya refieren que aunque no existiese esa supervisión por parte del radiólogo de las mamografías consideradas como normales por el SIA, la tasa de detección seguiría siendo superior en este grupo que en aquel que no tenga soporte de SIA. 

En cualquier caso los SIA seguirían siendo útiles empleados como herramienta de ayuda y de clasificación previa al cribado aún sin capacidad de exclusión, por el simple hecho de reducir el tiempo de lectura de la mamografía que haya sido considerada normal por el SIA, de forma similar al estudio alemán mencionado y por otro lado permitirían clasificar los estudios considerando su grado de prioridad de lectura, logrando una mayor rapidez en la valoración de los casos más sospechosos. 

Por último debería de considerarse la posibilidad de que el SIA realizase la integración automática de los datos por él obtenidos en los formularios del programa informático que se está desarrollando en la actualidad: densidad, bi-rads, factores de riesgo, antecedentes familiares, THS, tipo y características de la lesión con la consiguiente reducción de la carga de trabajo del radiólogo.

Los SIA han llegado, como se dice coloquialmente, para quedarse. Son muchos los intereses en su desarrollo, no solo desde el punto de vista de la atención y gestión sanitaria, sino también de carácter empresarial y comercial. Por ello hay que ser muy exigentes con el fin de obtener y entrenar algoritmos en IA que den respuesta a todos estos retos y garantizar que cumplen las obligaciones relacionadas con la: fiabilidad, robustez técnica, seguridad, privacidad y gobierno de datos, transparencia, auditabilidad, no discriminación, equidad, reducción del impacto ambiental, supervisión y marcado CE. 

En este sentido se ha publicado recientemente un magnífico documento de consenso[6] de las principales Sociedades de Radiología americanas, europeas, canadiense y australiana que plantea las principales consideraciones prácticas en relación al desarrollo, adquisición, implementación y monitorización de los SIA en Radiología. 

Los PDP de cáncer de mama son una excelente estrategia de salud pública y han demostrado que son capaces de reducir la tasa de mortalidad por este tumor. Debemos asegurar su continuidad y calidad por encima de la amenaza que supone el esfuerzo económico y sanitario. Los SIA han llegado para colaborar en esta tarea. No aceptar su ayuda podría llevar a los PDP, permítanme la expresión, a morir de éxito.

Palabras clave: cribado mama inteligencia artificial sia

Bibliografía

[1]    Duffy Stephen W., Tabár L. et al. Beneficial Effect of consecutive Screening Mammography Examinations on mortality from breast cancer: a prospective study.
Radiology 2021; 299: 541 - 547
[2]    Gotzsche P., Olsen O. Is screening for breast cancer with mammography justifiable?
Lancet 2000; 355: 129 - 133
[3]    Parlamento Europeo. Enmiendas aprobadas por el Parlamento Europeo el 14 de Junio de 2023 sobre la propuesta de Reglamento del Parlamento Europeo y del Consejo por el que se establecen normas armonizadas en materia de inteligencia artificial (Ley de Inteligencia Artificial) y se modifican determinados actos legislativos de la Unión. Disponible en https://www.europarl.europa.eu/doceo/document/TA-9-2023-0236.ES.html
[4]    Eisenmann N. et al. Nationwide real-world implementation of AI for cancer detection in population-based mammography screening.
Nature Medicine. Published online: 07 January 2025. https://dol.org/101038/s41591-024-03408-6
[5]    Morales Santos A. y col. La regulación legal de la Inteligencia Artificial en la Unión Europea: guía práctica para radiólogos.
Radiología 66 (2024) 431 – 446
[6]    Adrian P. Brady et al. Developing, purchasing, implementing and monitoring AI tools in Radiology: practical considerations. A multi – society statement from the ACR, CAR, ESR, RAWZCR and RSNA. Radiology: Artificial Intelligence 2024; 6 (1): e 230513

Cita de la publicación original:

Juan Carlos Bayón Yusta, Lorea Galnares Cordero, Iñaki Gutiérrez
Ibarluzea. Vitoria-Gasteiz. Ministerio de Sanidad, / Jaurlaritzaren Argitalpen Zerbitzu Nagusia, Servicio Central de Publicaciones del Gobierno Vasco; 2024

Número: 9 de 2025