Un método avanzado de aprendizaje automático para la predicción simultánea del riesgo de cáncer de mama y su jerarquización en población china: un estudio de cohorte prospectivo y modelado

Un método avanzado de aprendizaje automático para la predicción simultánea del riesgo de cáncer de mama y su jerarquización en población china: un estudio de cohorte prospectivo y modelado

El cáncer de mama (CM) sigue siendo el cáncer más diagnosticado en mujeres a nivel global, con aproximadamente 2,26 millones de nuevos casos reportados en 2020. En China, el CM constituye la principal causa de incidencia oncológica en mujeres, con alrededor de 416.000 nuevos casos en 2020. La creciente carga de CM en China subraya la necesidad urgente de herramientas de evaluación de riesgo efectivas y adaptadas a esta población. Los modelos tradicionales de predicción de riesgo, como los modelos de Gail, Claus y Tyrer–Cuzick, han mostrado precisión limitada, con áreas bajo la curva característica de operación del receptor (AUC) entre 0,55 y 0,65. Estos modelos suelen depender de métodos invasivos (pruebas genéticas, biopsias) inaccesibles para su aplicación masiva en China debido a limitaciones económicas y desigualdad en recursos médicos. Este estudio desarrolló modelos avanzados de aprendizaje automático para predecir y jerarquizar el riesgo de CM de manera precisa y no invasiva en población china.

El estudio utilizó datos de la Cohorte de Cáncer de Mama en Mujeres Chinas (BCCS-CW), que incluyó a 122.058 mujeres de 25–70 años del este de China, reclutadas en 2008–2009 y seguidas entre 2017–2020. Se recopilaron datos demográficos, fisiológicos, reproductivos, médicos, familiares, dietéticos, de estilo de vida y conocimiento sobre CM mediante entrevistas y mediciones fisiológicas. Los casos incidentes se identificaron mediante bases de datos de seguros médicos, registros de enfermedades y registros residenciales. El estudio siguió las guías TRIPOD y fue aprobado por los comités de ética del Segundo Hospital de la Universidad de Shandong y el Centro Nacional de Control de Enfermedades Crónicas No Transmisibles.

Se emplearon técnicas avanzadas de aprendizaje automático, incluyendo regresión logística penalizada (PLR), bootstrapping y aprendizaje por ensamblaje. El modelo EPLR (para riesgo a corto plazo) y el modelo EPLT (a largo plazo) se construyeron mediante un marco integrado basado en bagging. El EPLR incorporó 72 factores de riesgo no experimentales, mientras el EPLT incluyó 51 variables. Los modelos se entrenaron y validaron con datos de Shandong, y se validaron externamente con datos de Jiangsu, Hebei y Tianjin.

El rendimiento se evaluó mediante discriminación (AUC, curvas ROC, índice de reclasificación neta [NRI]) y calibración (gráficos de calibración, ratio observado/esperado [E/O]). El EPLR mostró AUC de 0,800 y 0,751 en validación interna y externa, respectivamente. El NRI frente al modelo BCRAM fue 0,164 (interna) y 0,268 (externa). El EPLT logró AUC de 0,692 y 0,760, con NRI superior a los modelos de Gail y HCBCP. Los análisis de calibración confirmaron la precisión predictiva de ambos modelos.

Un hallazgo clave fue la relevancia de factores no experimentales. El EPLR identificó la «satisfacción vital general» como el predictor más importante, seguido por estado menopáusico, antecedentes familiares de CM, hiperplasia mamaria y hábitos dietéticos. Los modelos superaron a los tradicionales al incorporar variables no invasivas, cruciales en entornos con recursos limitados. La estrategia de bootstrapping mitigó el desbalanceo de datos, y el ensamblaje mejoró la estabilidad y generalización. Además, los modelos jerarquizaron factores según su frecuencia de selección en múltiples PLR.

Limitaciones incluyen la validación externa restringida a tres provincias y el corto seguimiento del EPLT (tres años). Algunos factores establecidos (consumo de alcohol) no se incluyeron por baja relevancia, y no se consideraron subtipos de CM por falta de datos.

En conclusión, este estudio desarrolló modelos de predicción de riesgo de CM basados en aprendizaje automático, con discriminación y calibración superiores a modelos tradicionales en población china. Su enfoque no invasivo y jerarquización de factores ofrecen una herramienta práctica para tamizaje estratificado y prevención. Futuras investigaciones deberán validar estos modelos en poblaciones más diversas e incorporar subtipos de CM para mayor precisión.

doi.org/10.1097/CM9.0000000000002891