Extracción Automática de Categorías en Informes de RM Mamaria por PLN

Extracción Automática de Categorías de Observación y Evaluación en Informes de Resonancia Magnética Mamaria mediante Procesamiento de Lenguaje Natural

Introducción

El cáncer de mama sigue siendo uno de los más prevalentes y letales en mujeres a nivel mundial. La detección temprana y el diagnóstico preciso son críticos para mejorar los resultados clínicos. La resonancia magnética (RM) mamaria se ha convertido en una herramienta esencial para el diagnóstico y manejo del cáncer de mama, especialmente en mujeres de alto riesgo. El Colegio Americano de Radiología (ACR) desarrolló el sistema Breast Imaging Reporting and Data System (BI-RADS) para estandarizar la terminología en informes de imágenes mamarias, incluyendo RM. Sin embargo, la mayoría de los informes radiológicos siguen redactados en texto libre, lo que dificulta la extracción y análisis de datos. La extracción manual de esta información es laboriosa, propensa a errores e ineficiente en estudios con grandes muestras. El procesamiento de lenguaje natural (PLN) ofrece una solución prometedora para automatizar la extracción de datos estructurados, mejorando la eficiencia y precisión en el diagnóstico y la toma de decisiones.

Este estudio evalúa el rendimiento de un programa de PLN diseñado para extraer descriptores BI-RADS y categorías de evaluación final de informes de RM mamaria. El objetivo es cerrar la brecha entre el texto no estructurado y los datos estructurados, esenciales para sistemas de apoyo clínico.

Métodos

Población y Recolección de Datos

Se analizaron retrospectivamente 2330 informes de RM mamaria del Hospital Universitario de la Universidad de Pekín, recolectados entre el 23 de marzo de 2009 y el 1 de junio de 2017. La edad media de las pacientes fue 50,9 años (rango: 13–92 años). Los criterios de inclusión requirieron resultados patológicos posbiopsia o posoperatorios disponibles durante el examen o en un seguimiento de 3 meses. Los informes se dividieron en dos conjuntos: 1635 para el desarrollo del sistema de PLN y 695 como prueba independiente.

Lexicón Revisado BI-RADS para RM

El lexicón BI-RADS de RM se adaptó según los hábitos de redacción del departamento. Incluye dos categorías principales: evaluación global (tejido fibroglandular y realce parenquimatoso) y evaluación de lesiones (ubicación, morfología y cinética de realce). Los descriptores se organizaron en una ontología simple para facilitar el procesamiento con PLN.

Desarrollo del Sistema de PLN

El sistema se implementó usando un programa interno (Smartree Clinical Information System, Beijing, China). Las etapas fueron: segmentación de secciones y oraciones, tokenización, coincidencia de conceptos y detección de negaciones. Se preprocesó el texto para corregir errores ortográficos, expandir abreviaturas y homologar términos. La coincidencia con el lexicón BI-RADS se realizó mediante búsqueda exacta y por sinónimos. La detección de negaciones identificó conceptos ausentes o inciertos.

Evaluación del Sistema

El rendimiento del sistema se comparó con una revisión manual realizada por dos radiólogos certificados. Las discrepancias se resolvieron con un tercer revisor. Se calcularon la sensibilidad (recall) y el valor predictivo positivo (precisión) para la identificación correcta de descriptores y categorías BI-RADS. También se comparó el tiempo de procesamiento entre el método automático y manual.

Resultados

Extracción Manual

El primer revisor detectó 1258 lesiones (sensibilidad: 97,8%; precisión: 98,1%). El segundo identificó 1260 lesiones (sensibilidad: 97,1%; precisión: 97,7%). La concordancia interobservador fue alta (κ = 0,95).

Rendimiento del Algoritmo de PLN

El programa detectó 1279 lesiones (sensibilidad: 78,5%; precisión: 86,1%). El desempeño varió entre descriptores: sensibilidad (70,0–99,8%) y precisión (73,1–98,9%). Destacó en descriptores como realce parenquimatoso, forma de masa y linfadenopatía. El tiempo de procesamiento fue <1 segundo por informe, frente a 3,38 y 3,23 minutos/reporte en la revisión manual.

Discusión

El estudio demuestra la viabilidad de usar PLN para extraer datos estructurados de informes de RM mamaria. El sistema logró una precisión aceptable, aunque con variaciones según el descriptor. La baja sensibilidad en términos como tejido fibroglandular se atribuyó a frases no estandarizadas. La eficiencia del sistema resalta su utilidad en estudios a gran escala y entornos clínicos.

Limitaciones y Futuras Direcciones

La generalización del sistema está limitada por su desarrollo basado en informes de un solo centro. Futuros trabajos deberían incorporar datos multicéntricos. Además, el sistema actual extrae información de todas las lesiones, no solo de la lesión índice relevante para decisiones clínicas. Optimizaciones futuras podrían priorizar características de lesiones índice.

Conclusión

El programa de PLN desarrollado muestra alta precisión y sensibilidad para extraer descriptores BI-RADS de informes de RM mamaria. Su capacidad para procesar informes en <1 segundo ofrece una ventaja significativa frente a la revisión manual, facilitando aplicaciones en sistemas de apoyo clínico y mejora de la eficiencia diagnóstica.

doi.org/10.1097/CM9.0000000000000301

Deja una respuesta 0

Your email address will not be published. Required fields are marked *