HENUFOOD: Desarrollo de nuevas metodologías y tecnologías emergentes para la investigación bionutricional
El objetivo principal de este proyecto ha sido desarrollar metodologías innovadoras de evidenciación de la eficacia de alimentos con propiedades de salud, con el objetivo de mejorar las condiciones saludables en la población adulta.
Para alcanzar este objetivo principal, la estrategia fue apostar por metodologías innovadoras, que posibiliten:
- Investigar en nuevos biomarcadores de exposición (biodisponibilidad) y biomarcadores de efecto (de función, de reducción de riesgo de enfermedad y de seguridad)
- Proponer biomarcadores que puedan ser parametrizados, validados e indicativos de los procesos de interés en la mejora de la calidad de vida.
Esta apuesta estratégica ha significado el planteamiento de objetivos metodológicos concretos:
- El desarrollo los análisis por transcriptómica, proteómica y metabolómica como herramientas de investigación con una perspectiva integrada de los procesos bioquímicos que rigen la respuesta del organismo al entorno (incluyendo la dieta), modulando la misma y repercutiendo en el efecto sobre la salud
- Desarrollar metodologías por imagen para conseguir nuevos biomarcadores que reflejen la respuesta a estímulos sensoriales y procesos cognitivos
Para poder estudiar estos efectos, un objetivo inherente al proyecto y a la tipología de empresas que participan en el consorcio consistía en desarrollar e investigar en nuevos principios activos, extractos, ingredientes, y alimentos.
Objetivos de Ibermática dentro del marco del proyecto HENUFOOD
El objetivo general de Ibermática en el proyecto ha sido desarrollar herramientas computacionales para el apoyo, la sustentación de evidencias, la validación de resultados y la toma de decisiones sobre los procedimientos de estudios y ensayos científicos referentes a la investigación de las propiedades beneficiosas de los alimentos y su incidencia en la salud.
Este objetivo se fundamentaba en la constatación de que no existían plataformas de apoyo a la ayuda en la gestión de trabajos de estudios científicos que cubra las necesidades de validación, sugerencia, sustentación y control de los procesos de estudio en los ambientes de ensayos científicos, y especialmente, en el entorno de la nutrición aplicada a la salud.
Las necesidades funcionales a cubrir por los objetivos tecnológicos han sido las siguientes:
- Integrar los datos obtenidos con distintos modelos biológicos y generar conclusiones. Era necesaria una extracción de la información relevante en los datos, y relaciones no evidentes así como la selección automática de perfiles metabólicos y correlaciones entre distintos atributos.
- Optimizar el diseño de los estudios de intervención nutricional en humanos, en base a la generación de guías de actuación y corrección «on-line» sobre los procedimientos de actuación cuando el sistema detecte resultados con baja confiabilidad, así como el desarrollo de nuevas tecnologías computacionales de evidenciación y sustentación a partir del diseño protocolizado y parametrizado de estudios de intervención en humanos.
- Implantar Mecanismos de ayuda en la comprensión del mecanismo de acción, en base a los distintos resultados en las muestras de los ensayos en base a la aplicación de algoritmos de aprendizaje no supervisado.
- Desarrollar Un sistema de prevención de riesgos de enfermedades en base al establecimiento de umbrales de confianza sobre los indicadores correspondientes a biomarcadores de salud o enfermedad.
- La Aplicación de metodologías computacionales para la predicción «in silico» de efectos saludables de los nutrientes, así como la obtención estadística de las justificaciones de dichas acciones.
Se ha desarrollado una plataforma única, que satisface las necesidades anteriores, y además, oferta un apoyo a la gestión, guiado, validación y obtención de conclusiones de los ensayos científicos, que deben pasar necesariamente por tres estadios diferentes:
- Obtención, pre-procesado y tratamiento de los datos.
- Extracción de variables y atributos principales, así como indicadores de distintas fuentes externas (texto, bases de datos, imágenes, Web…).
- Identificación metabolitos: NIST Databases…
- Validación de los distintos modelos automáticos, apoyo inteligente a la toma de decisiones, y sustentación científica de los modelos validados.
- Comparación de perfiles y modelos (análisis multivariante)
- Interpretación inteligente e intuitiva de los datos
Para conseguir estos objetivos Ibermática ha contado con la colaboración de BDigital, y del Hospital Universitario La Paz, que han contribuido al conocimiento básico de las relaciones nutrientes-salud.
Líneas de investigación desarrolladas por Ibermática dentro del marco del proyecto
Para cubrir los requerimientos funcionales especificados, se han establecido una serie de líneas de investigación fruto del análisis del Estado del Arte en las principales tecnologías emergentes contempladas en el proyecto:
- Obtención, preprocesado y tratamiento de los datos de entrada al sistema.
Se ha construido la plataforma que da solución a la problemática asociada a la gestión inteligente de la información, en dos vertientes, la investigación en los métodos de obtención de la información, tanto a partir de los resultados de los indicadores obtenidos por biomarcadores, como la integración de datos no estructurados en fuentes externas (intranet, extranet, bases de datos especializadas o imágenes).
También se ha construido la plataforma que gestiona de forma inteligente los datos de los ensayos bionutricionales.
Se ha mejorado el desarrollo del paradigma de la «Medicina Basada en la Evidencia», y en la adquisición de conocimiento por vía de acceso semántico a la denominada «nube de Linked Data», de gran relevancia científica e innovadora, además de la inclusión en la plataforma de conectores a fuentes de datos de interés relacionados con el estado del arte en bionutrición.
Se ha confortando una plataforma de agregación bibliográfica sobre la base de anotaciones en lenguaje natural, y extracción de información en base a la ontología base del sistema.
Además, se ha implantado un sistema automático de extracción de datos relevantes en función de los datos suministrados por el conjunto de ensayos muestras, de forma que, en función de unos objetivos (dianas), se deciden qué modelos se han de aplicar a dichos datos (modelos estadísticos y de minería de datos), y cuáles son los atributos principales y multivariables que alimentan a dichos modelos. Para ello, se han ya realizando varias pruebas unitarias en una plataforma “wizard” guiada, que automatiza los procesos más complejos y especialistas dentro de la metodología CRIPS-DM de gestión de flujo de información dentro de minería de datos.
Como ayuda a la interpretación de resultados, se ha construido una plataforma de análisis visual en base a técnicas de Minería de Datos, y a un GUI (interface gráfico) que aúna ambas tecnologías en una propia, y de fácil uso por parte de usuarios especializados.
Todo el aplicativo esta integrado, de forma que las interacciones entre distintos silos de información de los diversos agentes que forman el sistema (Laboratorio, Usuarios, Gestión de Proyectos de Investigación y Ensayos Clínicos), y entre los distintos módulos, de forma que la información fluye en todos los puntos del ciclo de vida de un ensayo en forma de servicios.
- Validación de los distintos modelos automáticos, apoyo inteligente a la toma de decisiones, y sustentación científica de los modelos validados.
En paralelo al sistema de reglas se ha generado un sistema de modelado con distintas técnicas del estado del arte, que en base a los resultados del estudio, determinan la convergencia del modelo, su nivel de confianza en base a las premisas de origen (análisis de la hipótesis nula) y además, son capaces de explicar de forma contextual las conclusiones obtenidas. Este sistema permite predecir como respondería el sistema ante la variación de los indicadores de entrada.
Un motor de reglas (sistema experto) es el encargado de ejecutar en tiempo real las reglas obtenidas, así como las incluidas manualmente por los usuarios y validadores internos, en base a un sistema muy simple de introducción de las mismas.
El núcleo principal del sistema de decisión y control, es una ontología propia, que permite, en base a un vocabulario común, integrar la información relevante interna, publicitar los resultados de los ensayos, realizar un seguimiento de la vida del ensayo, y validar los procesos y datos según las normas preescritas, la calidad de los resultados, el valor de las muestras y su relación con los objetivos definidos «a priori». Esta estructura interrelacionada es completada con los datos de los ensayos, los resultados y las investigaciones realizadas, de forma que el acceso a la misma es en base a una navegación por enlaces, y además, ciertos motores semánticos permiten inferir nuevas conclusiones sobre los datos almacenados en ella.
- Interpretación de los datos.
Se ha implementado la interacción con los sistemas de minería de datos y sistemas expertos a través de preguntas directas sobre el objeto del estudio, cuáles son las variables independientes, los atributos a valorar, y sugerencias de métodos a aplicar o condiciones restrictivas a los modelos. Se trata de un lenguaje controlado que se abstrae de la base de datos y la terminología de minería de datos para permitir la interacción de alto nivel. Usamos una medida basada en el conocimiento de aspectos relevantes y subjetivos como la novedad, utilidad y comprensibilidad, que permite flexibilizar los métodos para acceder a los resultados de minería de datos, incluso en forma de preguntas en Lenguaje Natural.
Además, todos los datos de los ensayos, así como sus conclusiones a efectos de si el ensayo ha sido válido o no, se representan de forma visual, en un formato claro para aquellos investigadores que deseen «comprender» qué es lo que ha ocurrido con distintos indicadores, sin necesidad de ir a métricas estadísticas, como ANOVA, T-student, etc…
Se han integrando gráficas de visualización sobre los modelos matemáticos y frecuencias de conceptos relevantes obtenidos.
Más información en:
Análisis avanzado de Ensayos Bionutricionales en el Congreso Internacional de Nutrición (ICN2013)
Minería de datos y Sistemas Expertos
Minería de Datos en entornos Médicos o cómo dedicar el tiempo a analizar conclusiones y no datos. Los “medichackers”.
Minería de datos sobre ontologías
Adquisición de conocimiento para poblar Ontologías
El futuro del Text Mining se llama T2k (Text to Knowledge)Tucán – Un extractor automático de información relacionada
Sistema inteligente de gestión del conocimiento de laboratorios para procesado de cultivos microbiológicos
DocThor – Un auto-catalogador de Documentos automático en función del contenido
Buscadores semánticos en medicina: Codificación CIE-9 y Medicina Basada en la Evidencia
Entradas recientes
- Sonificación de datos para la supervisión de procesos en tiempo real / 1
- Tratamiento del Lenguaje Natural en Medicina mediante técnicas de IA. Caso de Uso de Hedai.
- El Futuro en Blockchain: IA & Semántica & Blockchain.
- «Semantic Learning» en Salud. Un ejemplo de Minería sobre Estructuras Semánticas
- Ibermática desarrolla un Sistema de Soporte a la Decisión Clínica para pacientes con cáncer de mama