Browsing articles tagged with " Cáncer de mama"

Ibermática desarrolla un Sistema de Soporte a la Decisión Clínica para pacientes con cáncer de mama

Ene 15, 2018   //   by Sandra Seijo Fernández   //   Minería de Datos  //  Comentarios desactivados en Ibermática desarrolla un Sistema de Soporte a la Decisión Clínica para pacientes con cáncer de mama

El cáncer de mama es el tumor más frecuente en mujeres de todo el mundo. Las últimas estimaciones de la Agencia Internacional de Investigación del Cáncer (IARC) hacen referencia al año 2012 [2] y muestran que cada año se diagnostican 1,68 millones de casos nuevos en la población femenina mundial. En España se diagnostican cada año unos 26.000 casos nuevos [5]. La supervivencia de las pacientes con cáncer de mama es alta y sigue una evolución ascendente en el tiempo. Los últimos datos disponibles en nuestro país muestran una supervivencia a 5 años algo superior al 80% [1]. A pesar de estas cifras esperanzadoras, el cáncer de mama continúa siendo un objetivo de salud muy relevante, ya que  supone la primera causa de mortalidad por cáncer en mujeres con  6.314 fallecimientos en 2011. Por lo tanto y teniendo en cuenta lo anteriormente mencionado, desde Ibermática se cree que una herramienta de ayuda a la toma de decisiones en esta enfermedad tan frecuente es de vital importancia, pudiendo aportar información relevante y facilitando la labor del personal médico.

Las decisiones clínicas pueden tomarse mediante razonamiento deductivo a partir del conocimiento de la fisiopatología humana. Más frecuentemente, se toman basándose en datos inciertos mediante estimaciones de probabilidades. Los clínicos realizan esta estimación de probabilidades de manera no formal y sin ser enteramente conscientes del proceso que realizan. La toma de decisiones es un proceso complejo que requiere el manejo de mucha información. La variabilidad en la práctica clínica y la falta de estandarización conlleva en muchas ocasiones iatrogenia y la mala praxis médica, que disminuye la eficiencia de los recursos disponibles. Casi desde la aparición de los primeros ordenadores se ha propuesto que las tecnologías de la información podrían ayudar al diagnóstico y tratamiento médicos. Inicialmente se escribieron programas que pretendían emular las capacidades diagnósticas de los clínicos, y se denominaron «sistemas expertos», con la pretensión de que iban a ser capaces de suplir la actividad deductiva de los clínicos. El estrepitoso fracaso de su introducción en la práctica, incluso cuando demostraban ser capaces de generar hipótesis correctas, ha desvelado muchos aspectos, tanto formales como prácticos, que condicionan la toma de decisiones en el ejercicio médico. Actualmente, los denominados Sistemas de Soporte a la Decisión Clínica (SSDC) son menos ambiciosos pero más efectivos [3].

Los Sistemas de Soporte a la Decisión Clínica (Figura 1) se definen como intervenciones diseñadas para ayudar a los clínicos a tomar decisiones específicas y deliberadas entre diversas opciones en torno a su salud, dentro de un contexto clínico; concretamente, cuando existe incertidumbre científica sobre los resultados de las diferentes opciones diagnósticas, pronostica y/o terapéuticas [4].

Figura 1: Esquema de los sistemas de soporte a las decisiones.

Desde Ibermática se ha desarrollado un Sistema de Soporte a la toma de Decisiones del personal médico para pacientes de cáncer de mama mediante, a partir de técnicas de Inteligencia Artificial (Analítica avanzada. Semántica), y el uso de distintas fuentes de información, tanto estructuradas como no estructuradas, de manera que permitan facilitar y agilizar la labor del personal médico ante esta enfermedad y ser capaz de mejorar la toma de decisiones ante un paciente nuevo mediante la comparación con pacientes similares a este o mediante  predicción de su tasa de supervivencia entre otros. Dichas fuentes de información  fueron provistas por el Instituto de Investigación Sanitaria Biocruces, quien también colaboró en el desarrollo de la herramienta, tanto mediante la provisión de las fuentes de información médicas utilizadas, como mediante el aporte de conocimiento necesario para entender la enfermedad.

Para el desarrollo de dicha herramienta, además de información médica proveniente de distintas fuentes de datos de distintos áreas (ginecología, registro tumoral, anatomía patológica y analíticas), también se contó con información relativa a factores medioambientales, más concretamente información relativa a la calidad del aire y del agua de los municipios de Euskadi.

Las distintas fuentes de información fueron unidas para cada paciente y posteriormente se realizó un estudio de los distintos indicadores de la calidad del dato con la finalidad de determinar la calidad de los distintos atributos y pacientes, eliminando aquellos que no superen un determinado umbral de calidad del dato, permitiendo así obtener un set de datos apropiado para la generación de conocimiento que facilite la generación de conocimiento a partir de los datos y tomar decisiones en base a la información obtenida.

Para la obtención de conocimiento mediante el modelado de los datos, primeramente se llevó a cabo junto a Biocruces un estudio de los atributos disponibles, definición del problema, entendimiento de la información y selección del objetivo. Finalmente, se seleccionó como objetivo para el pronóstico en el enfoque supervisado la tasa de supervivencia a 5 años desde el diagnóstico, ya que se trata de un estadístico muy usado en el campo del cáncer. Se realizaron unas primeras pruebas con dicho objetivo y se obtuvieron resultados interesantes, pero muy generales, por lo que finalmente se optó por un modelado en cascada para la obtención de reglas.

Figura 2: Algunas reglas para la clasificación de la tasa de supervivencia a 5 años.

 

Dicho modelado jerárquico primeramente obtiene una serie de reglas para clasificar la tasa de supervivencia a 5 años de los pacientes (ver Figura 2), es decir, obtiene reglas que permiten predecir si la tasa de supervivencia va a ser mayor o menos a 5 años. Posteriormente,  en un segundo nivel, nos centramos en los pacientes con peor pronóstico, es decir, en  los pacientes clasificados con una tasa de supervivencia menor a 5 años. Para dichos pacientes se obtienen otra serie de reglas que clasifican si los pacientes van a tener una tasa de supervivencia menor de 3 años, entre 3 y 5 años o una tasa de supervivencia mayor de 5 años (es decir, falsos positivos de las reglas generales), como se puede apreciar en la figura 3. De esta manera se logra obtener para aquellos pacientes con pronóstico más desfavorable (aquellos con tasa de supervivencia menor de 5 años) reglas más específicas y una clasificación más detallada.

.

Figura 3: Algunas reglas para la clasificación de las pacientes con tasa de supervivencia menor de 5 años.

Así mismo, se realizó un enfoque no supervisado para obtener información relevante a partir de los datos de los atributos de los pacientes así como las relaciones entre atributos, correlaciones y similitud entre pacientes con características similares. Como ejemplo de uno de los modelos que se llevaron a cabo en el enfoque no supervisado, se realizó un agrupamiento de los pacientes mediante una búsqueda evolutiva de los parámetros óptimos del algoritmo de agrupamiento que permitió obtener los mejores clústeres de pacientes sin necesidad de llevar a cabo un ajuste de parámetros o baterías de pruebas para dicho fin. Como se puede apreciar en la Figura 4 algunos de los atributos utilizados para generar los clústeres de pacientes, y cómo estos tienen características distintas según pertenezcan a  un determinado grupo de pacientes u otros. Este agrupamiento permite descubrir que características tienen en común los pacientes de un mismo clúster. Además, se puede determinar para un paciente específico a qué clúster pertenece y si todos sus atributos entran dentro de la normalidad en comparación con su clúster, y en caso de que sea anómalo para alguno de los atributos, saber cuál debería ser su valor (valor predominante en el clúster), y cuál es el valor que tiene ese paciente en realidad.

Figura 4: Proporción de clases de algunos de los atributos utilizados en el agrupamiento.

Durante el desarrollo de los distintos modelos que se realizaron, se obtuvieron resultados y conclusiones muy interesantes, como por ejemplo, aquellas referentes a la población de los pacientes. Respecto a este punto, se observó que en alguno de los modelos aparecía como atributo relevante el municipio, y al analizar este atributo más en profundidad, tal y como se puede apreciar en la Figura 5, la proporción de pacientes con tasa de supervivencia mayor de 5 años y los que tienen tasa de supervivencia menor que 5 años varia considerablemente de un municipio a otro, lo que podría indicar que hay algún factor relacionado con las poblaciones que tiene incidencia sobre la tasa de supervivencia a 5 años.

Figura 5: Frecuencia de pacientes con tasa de supervivencia a 5 años por municipio.

Como se ha comentado anteriormente, el modelado realizado para la herramienta de ayuda a la toma de decisiones para  pacientes con cáncer de mama es utilizado para proporcionar soporte en la decisión. Para este fin el modelado realizado, tanto en el enfoque supervisado como en el no supervisado,  es  utilizado ante un  nuevo paciente para proporcionar información que pueda ayudar al clínico en la toma de decisiones. Entre este tipo de información que se devuelve ante un nuevo paciente se encuentra la predicción más probable de la tasa de supervivencia a 5 años mediante la inferencia de sus valores específicos, las reglas que cumple dicho paciente, a que clúster específico pertenece, o si es anómalo para alguno de los valores de sus atributos y porque entre otros. Además, el sistema también devuelve los valores reales de dicho paciente  para algunos atributos relevantes en el cáncer de mama, de manera que con toda esta información disponible, el especialista sea capaz de apoyarse en el resultado de los modelos, teniendo en cuenta la tasa de supervivencia de pacientes con características similares,  las reglas y relaciones obtenidas para determinar las decisiones más adecuadas para dicho paciente.

Bibliografía

[1]     Asociación Española contra el cáncer. https://www.aecc.es/sobreelcancer/cancerporlocalizacion/cancermama/paginas/pronostico.aspx.

[2]     International Agency for Research on Cancer. https://www.iarc.fr/.

[3]     Ferrán Sanza Julio Bonisa, Juan J Sanchoa. Sistemas informáticos de soporte a la decisión clínica. Medicina Clínica, 122:39–44, 2004.

[4]     Jacobsen MJ. O’Connor AM. Workbook on Developing and Evaluating Patient Decision Aids. Ottawa Health Research Institute., 2003.

[5]     De Angelis R Larrañaga N Capocaccia R Martinez C Sanchez MJ, Payer T. Cancer incidence and mortality in spain: estimates and projections for the period 1981-2012. Ann Oncol, 30-36, 2010.