Juego de herramientas de anonimización multilingüe para las administraciones públicas-MAPA
MAPA
El proyecto MAPA (Multilingual Anonymisation toolkit for Public Administrations) desarrollará el kit de herramientas de código abierto para anonimizar datos en los ámbitos médico y legal, implantándolo en varias Administraciones Públicas en Europa.
En su núcleo, el kit de herramientas de anonimización MAPA utilizará las técnicas de Reconocimiento y Clasificación de Entidades Nombradas (NERC) utilizando tanto técnicas de Aprendizaje Profundo como redes neuronales.
Además, gracias a las capacidades de aprendizaje de transferencia que muestran los nuevos tipos de modelos de Aprendizaje Profundo, se pueden entrenar nuevos sistemas utilizando conjuntos de datos relativamente pequeños de datos etiquetados manualmente. Los conocimientos adquiridos para un determinado dominio o idioma pueden transferirse y reutilizarse en otros idiomas o dominios. El MAPA será capacitado para detectar entidades con nombre que involucren información sensible.
El MAPA tendrá muchas características y el enfoque NERC se complementará con otros mecanismos configurables, como la detección de patrones basados en expresiones regulares (números de pasaporte o de identificación, números de teléfono, direcciones, grupos sanguíneos, edad, sexo, estado civil, direcciones de correo electrónico, cuentas bancarias, etc.).
Los diccionarios definibles por el usuario para aplicaciones concretas también se ocuparán de usos específicos de nombres de entidades conocidos de antemano.
Como resultado obtiene un conjunto de herramientas de anonimización multilingüe para las administraciones públicas.
¿Buscas apoyo para tu próximo proyecto? Escríbenos, estamos deseando ayudarte.