Predicción de la tasa acumulada de nacidos vivos en pacientes sometidas a fertilización in vitro (FIV)/inyección intracitoplasmática de espermatozoides (ICSI) por infertilidad tubárica y masculina: un enfoque de aprendizaje automático mediante XGBoost
La infertilidad representa un problema global creciente, con un aumento notable en el uso de tecnologías de reproducción asistida (TRA). Entre estas, la FIV y la ICSI son métodos ampliamente utilizados. Sin embargo, sus tasas de éxito están influenciadas por múltiples factores, y los pacientes enfrentan altos costos y riesgos como el síndrome de hiperestimulación ovárica, infecciones y embarazos múltiples. La predicción precisa de los resultados es crucial para optimizar estrategias terapéuticas y mejorar el asesoramiento clínico. Los modelos estadísticos tradicionales, como la regresión logística, han mostrado limitaciones en su eficacia predictiva, lo que resalta la necesidad de enfoques más avanzados.
El avance tecnológico ha permitido integrar inteligencia artificial (IA) y aprendizaje automático (AA) en investigación médica. Entre los algoritmos de AA, eXtreme Gradient Boosting (XGBoost) destaca por su capacidad para analizar conjuntos de datos complejos. Este estudio tuvo como objetivo desarrollar un modelo predictivo mediante XGBoost para estimar la tasa acumulada de nacidos vivos (TANV) en pacientes sometidas a FIV/ICSI por infertilidad tubárica o masculina, comparando su desempeño con un modelo convencional de regresión logística.
Métodos
Se analizaron retrospectivamente datos de 3.012 pacientes tratadas en el Hospital Peking Union Medical College (China) entre julio de 2014 y marzo de 2018. Se excluyeron casos con uso de ovocitos/espermatozoides donantes, endometriosis, enfermedades endocrinas o datos incompletos. Las variables incluyeron características clínicas, niveles hormonales y parámetros de hiperestimulación ovárica controlada (HOC). El desenlace primario fue el nacido vivo definido como parto después de 28 semanas de gestación, considerando el primer ciclo fresco y subsecuentes ciclos criopreservados.
Los análisis estadísticos se realizaron con R y EmpowerStats. El modelo de regresión logística se construyó mediante selección escalonada de variables con remuestreo bootstrap. El modelo XGBoost se implementó usando el paquete de código abierto XGBoost, evaluando la importancia de características y umbrales de probabilidad. La eficacia predictiva se midió mediante sensibilidad, especificidad, valor predictivo positivo (VPP), valor predictivo negativo (VPN) y área bajo la curva ROC (AUC). Se utilizaron curvas de calibración y análisis de curva de decisión (DCA) para evaluar utilidad clínica.
Resultados
El conjunto de datos incluyó 2.101 casos de FIV y 911 de ICSI. El modelo XGBoost identificó como variables más relevantes: edad, niveles de estrógeno post-trigger (E21), prolactina post-trigger (PRL1), LH basal (LH0), LH post-trigger (LH1), estrógeno basal (E20), prolactina basal (PRL0) y dosis total de FSH. La regresión logística seleccionó edad, infertilidad secundaria, ICSI, ciclos previos de FIV, dosis de FSH, FSH basal (FSH0), testosterona basal (T0), PRL1, LH1, E21, progesterona post-trigger (P1) y testosterona post-trigger (T1).
El modelo XGBoost demostró superioridad predictiva con un AUC de 0.901 (IC 95%: 0.890–0.912) versus 0.724 (IC 95%: 0.708–0.741) del modelo convencional (p <0.001). Ambos mostraron buena calibración, pero el DCA reveló mayor beneficio neto para XGBoost.
Discusión
Este estudio resalta las ventajas del AA, particularmente XGBoost, para predecir resultados de TRA. La mayor capacidad discriminativa del modelo sugiere su utilidad en consejería personalizada y planificación terapéutica. Resultados alineados con estudios previos, como el modelo McLernon (índice C: 0.72–0.73), aunque sin incluir predictores como AMH o IMC. Trabajos recientes con bosques aleatorios reportan AUC de 0.81, pero sin comparación directa con modelos convencionales.
Las limitaciones incluyen diseño retrospectivo, reclutamiento unicéntrico y falta de validación externa. Futuras investigaciones deberán confirmar la robustez del modelo en cohortes multicéntricas.
Conclusión
El modelo XGBoost desarrollado demostró mayor precisión y utilidad clínica que la regresión logística para predecir TANV en FIV/ICSI. Su implementación podría optimizar estrategias terapéuticas, reduciendo riesgos y costos mediante predicciones individualizadas.
doi.org/10.1097/CM9.0000000000001874