Tratamiento del Lenguaje Natural en Medicina mediante técnicas de IA. Caso de Uso de Hedai.

Nov 15, 2018   //   by wpuser   //   S.Expertos  //  Comentarios desactivados en Tratamiento del Lenguaje Natural en Medicina mediante técnicas de IA. Caso de Uso de Hedai.

Las reformas en el sector de la salud han provocado un aumento de la presión continua sobre el coste durante los últimos años. Al mismo tiempo, las exigencias en la calidad del servicio en hospitales y con respecto a otros proveedores de servicios médicos son cada vez mayores. Junto con una situación competitiva, la demanda de coste y la gestión de la calidad en todos los ámbitos del sector sanitario, como en la terapéutica, en el diagnóstico, así como en el control en la administración, exigen nuevas medidas, con el fin de explotar con eficiencia la potenciabilidad de cada sector. Además, los sistemas actuales en el entorno de la salud están al borde de una transformación fundamental, como lo son los cambios de la medicina de “talla única” a la “medicina personalizada”, donde las decisiones que tomen los médicos, sus diagnósticos y tratamientos debe ser adaptados a las características individuales del paciente y su enfermedad específica. La personalización de la medicina está siendo impulsada por los últimos avances en proyección de imagen médica, la secuenciación de genes, la tecnología de imagen molecular, pero principalmente, por los avances de la Inteligencia Artificial aplicada al procesamiento del Lenguaje Natural.

La plataforma “Hedai” permite, en base a las información textual recogida en Historiales Clínicos, introducida por los clínicos en su propio lenguaje, y sin ningún formato estructurado, las siguientes funcionalidades:

  • Extractar la información relevante de cada paciente, a partir de los textos escritos en Lenguaje Natural por los facultativos.
  • Generar resúmenes médicos de forma automática, como visión general para  los especialistas clínicos puedan analizar, en un diagrama de tiempo, la evolución del paciente en  la toma de decisiones.
  • Perfilar a los pacientes: segmentar a los pacientes en grupos de patrones homogéneos, explicando cuáles son dichos patrones, y  triangular a cada paciente en un grupo particular.
  • Sugerir las mejores terapias en base a la información extractada de lenguaje natural de los historiales de los pacientes, como ayuda a la eficiencia terapéutica.

 

                                               Figura 1. Ejemplo de Fuentes de Datos en Lenguaje Natural

La técnicas avanzadas de análisis de información automática sobre información escrita en Texto Libre, en el propio lenguaje médico, extracción de conocimiento, y su traducción a reglas de actuación en sistemas expertos de ayuda “on-line” a la decisión, son aplicaciones de uso extendido en sistemas complejos industriales, de regulación, en marketing y en gestión de procesos, pero no así, están incluidos en los procesos de diagnóstico médico, y tratamiento, debido, principalmente, a un cultura de dar mayor peso a la experiencia profesional, y en otro sentido, a la poca inclusión que estas técnicas han tenido en los sistemas de información médicos.

El procesamiento del lenguaje natural es crucial, al encontrarse toda esa información en textos en formato libre, con información  no estructurada. Una gran parte del esfuerzo de PLN de investigación se ha centrado en la identificación de conceptos médicos en textos. En principio se debe distinguir entre terminologías médicas y ontologías. Ambas almacenan una lista de términos que representan conceptos médicos únicos, junto con sus expresiones sinónimas. Sin embargo, una ontología difiere de una terminología en que también incluye una serie de relaciones entre las entidades, del tipo “is a” o “part of”, con lo que las ventajas en el análisis posterior de los datos es evidente: “El conocimiento no está en la cantidad de datos de los que se dispone, sino en cómo dichos datos están relacionados entre sí en un contexto determinado” (Aitor Moreno), y precisamente esta funcionalidad es la que ofrecen las ontologías, sobre otros tipos de almacenamiento como las bases de datos tradicionales o los diccionarios.

En Hedai, los conceptos de las terminologías están ligados en una estructura de árbol o grafo, que también pueden ser vistos como relaciones entre conceptos. En este caso, se ha utilizado un recurso ontológico de dominio denominado Unified Medical Language System (UMLS) o Systematized Nomenclature of Medicine Clinical Terms (SNOMED-CT), que definen clases unificadas de conceptos médicos y un conjunto detallado de relaciones entre esos conceptos.

A partir de los Historiales Clínicos se genera una gran cantidad de información, que es almacenada en forma de grafos semánticos en la base de datos central del sistema. A partir de este punto, Hedai utiliza una serie de herramientas computacionales basadas en técnicas de Inteligencia Artificial, con los siguientes objetivos:

  • Analizar la Calidad de las Anotaciones, en base a una metodología propia de Ibermática, que denominamos “Análisis del Corpus”, y que permite confrontar las anotaciones semánticas realizadas contra un sistema de anotación estadístico, generado con técnicas de Machine Learning. Para leer más información sobre dicha metodología se puede acceder al siguiente paper [2]:
    [2] “Aitor Moreno-Fernandez-de-Leceta, Jose Manuel Lopez-Guede, Leire Ezquerro Insagurbe, Nora Ruiz de Arbulo, Manuel Graña; A novel methodology for clinical semantic annotations assessment, Logic Journal of the IGPL, , jzy021, https://doi.org/10.1093/jigpal/jzy021″

    (Los resultados de la Calidad del Corpus se pueden ver en la Figura 2).   

Figura 2. Resultados del Análisis del Corpus. 
  • Descubrir las relaciones semánticas que existen entre los conceptos anotados y almacenarlas en una base de datos temporal en forma de grafos semánticos, sobre la ontología del sistema “Hedai”. (Ver Figura 3).

Figura 3. Ontología del Sistema “Hedai”. 
  • Pautar la Relevancia de las Anotaciones: Extractar de toda el conocimiento obtenido (“triplas” semánticas), aquellas que son relevantes en función de un contexto, en base a una ponderación de pesos soportados en las jerarquías a las que pertenece cada una de las “triplas”.
  • Almacenar dicha información relevante, y sólo dicha información, en la base de datos semántica soportada por el sistema “REPCON” de Semantic System, sobre la estructura de una ontología clínica propia del sistema “Hedai”.
  • Analizar la Calidad de los Datos ya estructurada, en base a la metodología de Ibermática de Calidad de los Datos, soportada en este caso en la plataforma analítica SPSS Modeler. (Ver resultados de la Calidad de los Datos en la Figura 4).

Figura 4. Calidad de los Datos previos a su Modelización
  • Segmentar los pacientes en base a la información almacenada, por medios de segmentación automática, basándonos en la plataforma RapidMiner. (Ver Figura 5).

Figura 5. Perfilado de Pacientes en base a sus Históricos procesados.
  • Generar un modelo predictivo de recomendación terapeútica, en base a la información histórica, hibridando algoritmos de MachineLearning, (algoritmos de árboles de decisión y redes neuronales), sobre la plataforma RapidMiner. (Ver Figura 6).

Figura 6. Recomendación Terapéutica Personalizada.
  • Disponer de un Sistema de Reglas de Expertos, que permiten identificar, de toda la información relevante, cuál es el Diagnóstico Activo, los Diagnósticos Principales, Secundarios, y los Tratamientos Asociados. Dichas reglas están embebidas en el sistema semántico de “Hedai”.
  • Finalmente, generar un Resumen Automático de eventos por paciente (Ver Figura 7), desplegado sobre la plataforma de visualización Repcon de Semantic System, que nos permite analizar la información y realizar consultas clásicas, e incluso, analizar la similitud de clientes basándonos en consultas de Lenguaje Natural (Ver Figura 8)

Figura 7. Resumen de Eventos del Paciente

Figura 8. Similitud de Pacientes en Base a Preguntas en Lenguaje Natural.

A continuación, se adjunta un vídeo demostrativo de la Plataforma.

 

Conclusión

Como conclusión, las fuentes de datos no estructuradas, como en este caso, el texto libre, y su procesamiento, es una fuente de datos de vital importancia en la Medicina Personalizada, y plataformas como la presentada (Hedai) por Ibermática y Semantic System son una buena prueba de ello.

Este trabajo fue apoyado por el proyecto HEDAI (Health Data Integration), en el marco del programa Etorgai, con el apoyo del Gobierno Vasco. Así mismo, este trabajo no hubiera sido posible sin la ayuda del personal médico del Centro Onkologikoa, en su labor de la validación de los resúmenes clínicos.

Comments are closed.