Skip to content

Projet d'anonymisation de données. Utilisation de k-anonymisation, l-diversité, pseudonymisation et algorithmes unidimensionnel et multi-dimensionnel.

Notifications You must be signed in to change notification settings

MatthieuBonbon/Bucket3000

Repository files navigation

Bucket3000

Projet d'Anonymisation de données.

Les bases de données sont représentées par des tableurs auf format .ods . Les données sont catégorisées en 3 groupes dans les bases de données :

  • Les Identifiants : permettent d'identifier directement un individu

  • Les Quasi-identifiants : demandent un autre jeu de données mais représentent un risque

  • Les Données sensibles : rendent l'anonymisation obligatoire

La répartition des données est la suivante : les identifiants en premières colonnes, suivis des quasi-identifiants, d'éventuels attributs non-sensibles et enfin d'une unique colonne de données sensibles.

Plusieurs techniques d'anonymisation de données sont implémentées dans ce projet :

Le principe de fonctionnement de ces méthodes d'anonymisation est détaillé ici : https://github.com/MatthieuBonbon/Bucket3000/blob/main/anonymisation.md

Implémenté en Java. Code commenté au format JavaDoc qu'il est possible de générer.

Librairies utilisées :

Avec le soutien de Tristan Biot & others.

About

Projet d'anonymisation de données. Utilisation de k-anonymisation, l-diversité, pseudonymisation et algorithmes unidimensionnel et multi-dimensionnel.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages