Génération de données synthétique en utilisant le concept de confidentialité différentielle et mise en lien avec d’autres mesures de confidentialité

Beneva est une entreprise québécoise à caractère mutualiste, qui offre des produits en assurances et en services financiers. Dans le contexte de la loi 25 adoptée par le gouvernement du Québec pour renforcer la protection des renseignements personnels, en adaptant les règles en matière de confidentialité aux nouvelles réalités numériques, Beneva a été soumise à des obligations accrues en termes de gestion, de collecte et de divulgation des données personnelles. L’une des solutions envisageables pour se conformer à ces exigences est l’anonymisation des renseignements personnels (RP). Cette méthode permet de transformer les données de manière qu’elles ne puissent plus être associées à une personne identifiable, tout en préservant leur utilité pour l’analyse statistique et la prise de décisions.
Afin de renforcer ses processus de protection des données confidentielles, Beneva souhaite tirer parti d’un partenariat avec Prof. Anne-Sophie Charest du département de mathématiques et de statistique de l’Université de Laval, en s’alliant pour approfondir les méthodes d’anonymisation des données. Beneva utilise déjà l’approche de la génération de données synthétiques, basée sur des modèles génératifs CTGANs [1] et TVAE [2]. Cependant, plus le degré de conservation des propriétés statistiques est élevé, plus le risque d’identification est élevé, même avec des données synthétiques. Un juste équilibre est alors souhaitable. Beneva vise ainsi à améliorer les méthodologies existantes en introduisant dans le processus de génération de données synthétiques un paramètre qui permet de générer des données avec le degré de confidentialité/utilité souhaité selon le besoin de partage. Plusieurs méthodes sont à tester, dont l’ajout de la notion de confidentialité différentielle, lors de la génération des données synthétiques, avec l’objectif de satisfaire certaines métriques de divulgation existantes qui sont calculées a posteriori.
En plus de se conformer aux réglementations sur la protection des renseignements personnels, le projet représente des avantages économiques, tels que :
1. Amélioration des performances des modèles d’IA.
2. Facilitation du partage et de la collaboration : qui permet d’Accélérer des partenariats et collaborations internes et externes.
3. Réduction des délais de mise en marché : en évitant les contraintes liées à l’accès aux données réelles.
Le projet a aussi des avantages sociaux, tels que :
1. Renforcement de la protection des données des clients.
2. Contribution à l’innovation et à la recherche : en permettant aux chercheurs et aux équipes internes de tester de nouvelles approches sans compromettre la sécurité des données.
3. Accessibilité et démocratisation des analyses de données.
4. Soutien à la mission mutualiste.

Faculty Supervisor:

Anne-Sophie Charest

Student:

Partner:

Beneva

Discipline:

Mathematics

Sector:

Finance and Insurance

University:

Université Laval

Program:

Accelerate

Current openings

Find the perfect opportunity to put your academic skills and knowledge into practice!

Find Projects