Towards privacy-preserving publication of continuous and dynamic : spatial indexing and bucketization approaches
La publication de données soucieuse du respect de la vie privée est au coeur des préoccupations des organisations qui souhaitent publier leurs données. Un nombre croissant d entreprises et d organismes collectent et publient des données à caractère personnel pour diverses raisons (études démographiq...
Auteurs principaux : | , , |
---|---|
Collectivités auteurs : | , , |
Format : | Thèse ou mémoire |
Langue : | anglais français |
Titre complet : | Towards privacy-preserving publication of continuous and dynamic : spatial indexing and bucketization approaches / Adeel Anjum; sous la direction de Marc Gelgon, Guillaume Raschia |
Publié : |
[S.l.] :
[s.n.]
, 2013 |
Accès en ligne : |
Accès Nantes Université
|
Note de thèse : | Thèse de doctorat : Informatique et applications : Nantes : 2013 |
Sujets : | |
Documents associés : | Reproduction de:
Towards privacy-preserving publication of continuous and dynamic |
LEADER | 05912clm a2200469 4500 | ||
---|---|---|---|
001 | PPN177406895 | ||
003 | http://www.sudoc.fr/177406895 | ||
005 | 20240829055200.0 | ||
029 | |a FR |b 2013NANT2025 | ||
035 | |a (OCoLC)1247855104 | ||
100 | |a 20140404d2013 k y|frey0103 ba | ||
101 | 0 | |a eng |a fre |d eng |d fre |2 639-2 | |
102 | |a FR | ||
105 | |a ||||v 00||| | ||
135 | |a |r||||||||||| | ||
200 | 1 | |a Towards privacy-preserving publication of continuous and dynamic |b Ressource électronique |e spatial indexing and bucketization approaches |f Adeel Anjum |g sous la direction de Marc Gelgon, Guillaume Raschia | |
210 | |a [S.l.] |c [s.n.] |d 2013 | ||
230 | |a Données textuelles | ||
300 | |a Thèse rédigée en anglais avec un résumé étendu de 53 feuillets en français | ||
320 | |a Références bibliographiques | ||
325 | 1 | |a La thèse papier est la seule version officielle | |
328 | |b Thèse de doctorat |c Informatique et applications |e Nantes |d 2013 | ||
330 | |a La publication de données soucieuse du respect de la vie privée est au coeur des préoccupations des organisations qui souhaitent publier leurs données. Un nombre croissant d entreprises et d organismes collectent et publient des données à caractère personnel pour diverses raisons (études démographiques, recherche médicale,...). Selon ces cas, celui qui publie les données fait face au dilemme suivant : comment permettre à un tiers l analyse de ces données tout en évitant de divulguer des informations trop sensibles, relatives aux individus concernés? L enjeu est donc la capacité à publier des jeux de données en maîtrisant ce risque de divulgation, c.a.d. de traiter l opposition entre deux critères : d un côté, on souhaite garantir la préservation de la confidentialité sur des données personnelles et, d autre part, on souhaite préserver au maximum l utilité du jeu de données pour ceux qui l exploiteraient (notamment, des chercheurs). Dans ce travail, nous cherchons d abord à élaborer plusieurs notions d anonymisation des données selon plusieurs contextes. Nous montrons que les index spatiaux sont extrêmement efficaces dans le cadre de la publication de données, en raison de leur capacité à passer à l échelle. Une évaluation empirique approfondie révèle qu il est possible de diffuser des données de grande qualité et préservant un certain niveau de confidentialité dans les données. Il est de plus possible de traiter efficacement de très grands jeux de données en grandes dimensions et cette méthode peut être étendue à un niveau de confidentialité plus fort (differential privacy). Par ailleurs, la publication séquentielle de données (mise à jour du jeu de données) est cruciale dans un grand nombre d applications. Nous proposons une technique menant à bien cette tâche, garantissant à la fois une forte confidentialité des données et une très bonne préservation de leur utilité. | ||
330 | |a Privacy-Preserving Data Publishing (PPDP) has become a critical issue for companies and organizations that would release their data. Many organizations collect and distribute personal data for a variety of different purposes, including demographic and public health research. In these situations, the data distributor is often faced with a dilemma: how to publish this personal data for analysis purposes without endangering the privacy of the concerned individuals? Disseminating such information without the privacy scare is an important problem. On one hand, the data publishers need to protect the privacy of individuals and on the other hand, it is also extremely important to preserve the usefulness of the data for the researchers. In this dissertation, we mainly focus on crafting the notions of privacy in various settings. We show that spatial indexes are extremely efficient for data publication tasks due to their ability to scale up. An extensive empirical evaluation reveals that it is possible to disseminate high-quality data that follows meaningful notions of privacy. Furthermore, it is possible to do this efficiently for high dimensional very large data sets and this approach can be extended to stronger notions of privacy e.g., differential privacy. Also, sequential data is being increasingly employed in a wide variety of applications and the publication of sequential data is of utmost importance for the betterment of these applications. We provide a bucketization-based approach to achieve a stronger privacy guarantee along with higher utility of final release | ||
455 | | | |0 177406518 |t Towards privacy-preserving publication of continuous and dynamic |o spatial indexing and bucketization approaches |f Adeel Anjum |c [S.l.] |n [s.n.] |d 2013 |p 1 vol. (188 p.) | |
541 | | | |a Publication de données qui préservent la vie privée pour des données continues et dynamiques : les approches d indexation spatiale et de Bucketisation |z eng | |
606 | |3 PPN02801877X |a Protection de l'information (informatique) |2 rameau | ||
606 | |3 PPN035198222 |a Exploration de données |2 rameau | ||
608 | |3 PPN027253139 |a Thèses et écrits académiques |2 rameau | ||
610 | 0 | |a Bucketisation |a k-anonymity | |
686 | |a 004 |2 TEF | ||
700 | 1 | |3 PPN177403926 |a Anjum |b Adeel |f 1982-.... |4 070 | |
701 | 1 | |3 PPN133954633 |a Gelgon |b Marc |4 727 | |
701 | 1 | |3 PPN070662886 |a Raschia |b Guillaume |4 727 | |
711 | 0 | 2 | |3 PPN026403447 |a Université de Nantes |c 1962-2021 |4 295 |
711 | 0 | 2 | |3 PPN033124884 |a Université de Nantes |b Faculté des sciences et des techniques |4 295 |
711 | 0 | 2 | |3 PPN134103211 |a École doctorale Sciences et technologies de l'information et mathématiques |c Nantes |4 295 |
801 | 3 | |a FR |b Abes |c 20230206 |g AFNOR | |
856 | 4 | |q PDF |u https://archive.bu.univ-nantes.fr/pollux/show/show?id=f4f0e321-10b7-41ed-a6f6-a57af9f0ddf4 |2 accès au texte intégral de la thèse | |
979 | |a SCI | ||
930 | |5 441092104:504075292 |b 441092104 |j g | ||
998 | |a 661228 |