SYNTHEMA-Generación sintética de datos hematológicos en marcos informáticos federados
SYNTHEMA
Duración:
01.12.2022 - 30.11.2026
Las enfermedades hematológicas (HD) son un grupo amplio de trastornos resultantes de anormalidades cuantitativas o cualitativas de células sanguíneas, órganos linfoides y factores de coagulación. A pesar de que la mayoría de ellas son raras, el número total de pacientes afectados por este tipo de enfermedades en todo el mundo es significativo, lo que representa una carga económica considerable para los sistemas de atención médica y la sociedad.
Objetivo del Proyecto
SYNTHEMA , centro transfronterizo para desarrollar y validar técnicas de inteligencia artificial respaldadas por el aprendizaje federado, para la anonimización y generación de datos sintéticos en enfermedades hematológicas raras. Este proyecto tiene como objetivo generar datos sintéticos fiables y de alta calidad que puedan modelar nuevos pacientes virtuales para mejorar aún más la capacidad de diagnóstico, evaluar opciones de tratamiento y predecir resultados en enfermedades hematológicas raras.
A pesar de la existencia de varios grupos de investigación colaborativa a nivel nacional y de la UE, los enfoques clínicos actuales a menudo son ineficaces, especialmente para las condiciones más raras, debido al relativamente bajo número de pacientes por enfermedad y al alto número de entidades clínicas no conectadas. SYNTHEMA tiene como objetivo establecer un centro de datos transfronterizo donde desarrollar y validar técnicas innovadoras basadas en IA para la anonimización de datos clínicos y generación de datos sintéticos (SDG), para abordar la escasez y fragmentación de datos y ampliar la base para la investigación compatible con el RGPD en enfermedades hematológicas raras. El proyecto se centrará en dos casos de uso representativos de RHD: la enfermedad de células falciformes (ECF) y la leucemia mieloide aguda (LMA).
Rol de Vicomtech
Vicomtech lidera el Paquete de Trabajo nº3: Anonimización de datos y generación de datos sintéticos. También participa en el diseño e implementación de tres aspectos clave del proyecto: la plataforma de aprendizaje federado, métricas para la evaluación de la privacidad de los datos sintéticos generados y la fidelidad y utilidad de los datos sintéticos generados. Vicomtech avanzará en tecnologías de Aprendizaje Profundo aplicadas a la generación de datos sintéticos, como Redes Generativas Adversarias o modelos de Difusión. En cuanto a las métricas, Vicomtech avanzará en la definición e implementación de métricas innovadoras tanto generales como específicas para los casos de uso del proyecto. Además, trabajará en técnicas de análisis visual para visualizar estos dos aspectos clave de los datos sintéticos, su utilidad y privacidad.
Tecnologías empleadas
SYNTHEMA desarrollará una infraestructura de aprendizaje federado (FL), equipada con protocolos de computación segura multiparte (SMPC) y privacidad diferencial (DF), conectando centros clínicos que aportarán conjuntos de datos multimodales estandarizados e interoperables y centros informáticos de la academia y las pymes. Este marco se utilizará para entrenar los algoritmos desarrollados y realizar la agregación de modelos globales basada en SMPC de manera que proteja la privacidad. Los datos resultantes se validarán en términos de su valor clínico, utilidad estadística y riesgos residuales para la privacidad. El proyecto desarrollará marcos legales y éticos para garantizar la privacidad por diseño en la recopilación y procesamiento de datos personales relacionados con la salud y logrará una co-creación ética de algoritmos.
Sector de aplicación
Los resultados del proyecto, incluidos los flujos de trabajo, estándares y datos, estarán disponibles abiertamente para las partes interesadas en el campo de la salud, la academia y la industria, y contribuirán a los registros existentes de enfermedades raras.
Socios del proyecto
El consorcio está liderado por la Universidad Politécnica de Madrid, que también dirige el diseño y la implementación de la infraestructura de aprendizaje federado. El resto de los socios son:
DATAWIZARD
SBA RESEARCH GEMEINNUTZIGE GMBH AT
Australo
ALMA MATER STUDIORUM - UNIVERSITA DIBOLOGNA
Vicomtech
THE EUROPEAN INSTITUTE FOR INNOVATION THROUGH HEALTH DATA
FUNDACIO HOSPITAL UNIVERSITARI VALL D'HEBRON
HUMANITAS MIRASOLE SPA
UNIVERSITAIR MEDISCH CENTRUM UTRECHT
ASSISTANCE PUBLIQUE HOPITAUX DE PARIS
CHARITE - UNIVERSITAETSMEDIZIN BERLIN
GLSMED LEARNING HEALTH SA
UNIVERSITA DEGLI STUDI DI PADOVA
NETCOMPANY-INTRASOFT SA
UNIVERSITY OF SOUTHAMPTON
Financiación del proyecto
Programa Horizon Europe
¿Buscas apoyo para tu próximo proyecto? Escríbenos, estamos deseando ayudarte.