Aprendizaje Automático con Restricciones de Privacidad para Computación en la Frontera

A2 PRIVCOMP

Objetivos del proyecto

 

El proyecto A2-PRIVCOMP se centra en definir y desarrollar soluciones tecnológicas que contribuyan a las áreas transversales de privacidad, seguridad y gestión del dato en el ecosistema cloud-edge. El impacto perseguido a medio y largo plazo consiste en incrementar la confianza de los usuarios y empresas en los servicios, aplicaciones y plataformas que ejecutan sus servicios sobre la infraestructura cloud-edge.

El proyecto plantea cuatro contribuciones tecnológicas concretas.

  • Uso de Machine Learning para la detección y mitigación de los riesgos asociados a la distribución y gestión de malware en el ecosistema cloud-edge público.
  • Desarrollo de una plataforma para gobernanza del dato con garantías de privacidad para servicios cloud-edge.
  • Modelos de generación de datos sintéticos para soluciones de machine learning con garantías de privacidad en el entorno edge-cloud.
  • Metodología para medir la exposición de datos personales en aplicaciones populares en el ecosistema cloud-edge.

Desde Vicomtech, estamos investigando el uso de modelos de generación de datos sintéticos para soluciones machine learning con garantías de privacidad con los siguientes objetivos:

  • Identificar y analizar los modelos generadores de datos sintéticos para soluciones de machine learning con garantías de privacidad existentes.
  • Poner en marcha e implementar modelos generadores de datos sintéticos para soluciones machine learning con garantía de privacidad.
  • Diseñar una metodología para evaluar los datos sintéticos generados por los modelos generadores asegurando un equilibrio entre utilidad y privacidad de los datos.
  • Proveer un prototipo validado aplicable a infraestructuras cloud-edge para la compartición de datos sintéticos de forma segura y privada para casos de uso de industria y servicios públicos.
  • Generar contenido científico para fortalecer la industria digital de la UE en un marco de seguridad informática y resiliencia mediante asistencia a conferencias y publicaciones en revistas científicas.

 

Trabajo realizado, conclusiones y próximos pasos

 

Hasta el momento se ha realizado el "Estudio del estado del arte sobre modelos generadores de datos sintéticos para soluciones machine learning" que resume las tendencias y avances más destacados en la investigación sobre modelos generadores de datos sintéticos para soluciones de ML, con especial atención en la preservación de la privacidad. Por un lado, se observa una tendencia reciente hacia el uso de modelos de difusión y redes generativas adversarias para la generación de datos sintéticos, mientras que, por otro lado, se concluye que no existe una forma universal ni objetiva para evaluar la fidelidad y privacidad de los datos generados sintéticamente por estos modelos generativos. Además, se pone de relieve la importancia de la integración de modelos generativos con otras tecnologías que ayudan a preservar la privacidad de los datos, como por ejemplo, el aprendizaje federado, la privacidad diferencial y el uso de flujos de procesamiento seguro de datos.

Los próximos pasos en los que se está empezando a trabajar son los siguientes:

  • La definición e implementación de modelos generadores de datos sintéticos con garantías de privacidad, basados en modelos de difusión y redes generativas adversarias.
  • La recopilación de métricas y métodos para evaluar los datos generados por estos modelos con el objetivo de crear una metodología universal de evaluación de fidelidad y privacidad.
  • El desarrollo y prototipado de una herramienta para la generación y evaluación de datos sintéticos que pueda ser implementada en arquitecturas basadas en cloud-edge.

 

Colaboración con la UC3m y el apoyo de la administración

 

A2-PRIVCOMP: Aprendizaje Automático con Restricciones de PRIVacidad para COMPputación en la Frontera, es un proyecto financiado dentro del programa UNICO I+D Cloud  en el marco del Plan de Recuperación, Transformación y Resiliencia, financiado por la Unión Europea con los fondos NextGenerationEU. El coordinador de este proyecto es Universidad Carlos III de Madrid, el cual lanzó un concurso publico para subcontratar el paquete de desarrollo de  “Generación  de  datos  sintéticos  para    soluciones  machine  learning  con  garantías  de privacidad para la infraestructura cloud-edge”, siendo Vicomtech el adjudictario de dicha licitación.  

¿Buscas apoyo para tu próximo proyecto? Escríbenos, estamos deseando ayudarte.

Vicomtech

Parque Científico y Tecnológico de Gipuzkoa,
Paseo Mikeletegi 57,
20009 Donostia / San Sebastián (España)

+(34) 943 309 230

Zorrotzaurreko Erribera 2, Deusto,
48014 Bilbao (España)

close overlay

Las cookies de publicidad comportamental son necesarias para cargar el contenido

Aceptar cookies de publicidad comportamental