Towards privacy-preserving publication of continuous and dynamic : spatial indexing and bucketization approaches

La publication de données soucieuse du respect de la vie privée est au coeur des préoccupations des organisations qui souhaitent publier leurs données. Un nombre croissant d entreprises et d organismes collectent et publient des données à caractère personnel pour diverses raisons (études démographiq...

Description complète

Détails bibliographiques
Auteurs principaux : Anjum Adeel (Auteur), Gelgon Marc (Directeur de thèse), Raschia Guillaume (Directeur de thèse)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance)
Format : Thèse ou mémoire
Langue : anglais
français
Titre complet : Towards privacy-preserving publication of continuous and dynamic : spatial indexing and bucketization approaches / Adeel Anjum; sous la direction de Marc Gelgon, Guillaume Raschia
Publié : [S.l.] : [s.n.] , 2013
Accès en ligne : Accès Nantes Université
Note de thèse : Thèse de doctorat : Informatique et applications : Nantes : 2013
Sujets :
Documents associés : Reproduction de: Towards privacy-preserving publication of continuous and dynamic
LEADER 05912clm a2200469 4500
001 PPN177406895
003 http://www.sudoc.fr/177406895
005 20240829055200.0
029 |a FR  |b 2013NANT2025 
035 |a (OCoLC)1247855104 
100 |a 20140404d2013 k y|frey0103 ba 
101 0 |a eng  |a fre  |d eng  |d fre  |2 639-2 
102 |a FR 
105 |a ||||v 00||| 
135 |a |r||||||||||| 
200 1 |a Towards privacy-preserving publication of continuous and dynamic  |b Ressource électronique  |e spatial indexing and bucketization approaches  |f Adeel Anjum  |g sous la direction de Marc Gelgon, Guillaume Raschia 
210 |a [S.l.]  |c [s.n.]  |d 2013 
230 |a Données textuelles 
300 |a Thèse rédigée en anglais avec un résumé étendu de 53 feuillets en français 
320 |a Références bibliographiques 
325 1 |a La thèse papier est la seule version officielle 
328 |b Thèse de doctorat  |c Informatique et applications  |e Nantes  |d 2013 
330 |a La publication de données soucieuse du respect de la vie privée est au coeur des préoccupations des organisations qui souhaitent publier leurs données. Un nombre croissant d entreprises et d organismes collectent et publient des données à caractère personnel pour diverses raisons (études démographiques, recherche médicale,...). Selon ces cas, celui qui publie les données fait face au dilemme suivant : comment permettre à un tiers l analyse de ces données tout en évitant de divulguer des informations trop sensibles, relatives aux individus concernés? L enjeu est donc la capacité à publier des jeux de données en maîtrisant ce risque de divulgation, c.a.d. de traiter l opposition entre deux critères : d un côté, on souhaite garantir la préservation de la confidentialité sur des données personnelles et, d autre part, on souhaite préserver au maximum l utilité du jeu de données pour ceux qui l exploiteraient (notamment, des chercheurs). Dans ce travail, nous cherchons d abord à élaborer plusieurs notions d anonymisation des données selon plusieurs contextes. Nous montrons que les index spatiaux sont extrêmement efficaces dans le cadre de la publication de données, en raison de leur capacité à passer à l échelle. Une évaluation empirique approfondie révèle qu il est possible de diffuser des données de grande qualité et préservant un certain niveau de confidentialité dans les données. Il est de plus possible de traiter efficacement de très grands jeux de données en grandes dimensions et cette méthode peut être étendue à un niveau de confidentialité plus fort (differential privacy). Par ailleurs, la publication séquentielle de données (mise à jour du jeu de données) est cruciale dans un grand nombre d applications. Nous proposons une technique menant à bien cette tâche, garantissant à la fois une forte confidentialité des données et une très bonne préservation de leur utilité. 
330 |a Privacy-Preserving Data Publishing (PPDP) has become a critical issue for companies and organizations that would release their data. Many organizations collect and distribute personal data for a variety of different purposes, including demographic and public health research. In these situations, the data distributor is often faced with a dilemma: how to publish this personal data for analysis purposes without endangering the privacy of the concerned individuals? Disseminating such information without the privacy scare is an important problem. On one hand, the data publishers need to protect the privacy of individuals and on the other hand, it is also extremely important to preserve the usefulness of the data for the researchers. In this dissertation, we mainly focus on crafting the notions of privacy in various settings. We show that spatial indexes are extremely efficient for data publication tasks due to their ability to scale up. An extensive empirical evaluation reveals that it is possible to disseminate high-quality data that follows meaningful notions of privacy. Furthermore, it is possible to do this efficiently for high dimensional very large data sets and this approach can be extended to stronger notions of privacy e.g., differential privacy. Also, sequential data is being increasingly employed in a wide variety of applications and the publication of sequential data is of utmost importance for the betterment of these applications. We provide a bucketization-based approach to achieve a stronger privacy guarantee along with higher utility of final release 
455 | |0 177406518  |t Towards privacy-preserving publication of continuous and dynamic  |o spatial indexing and bucketization approaches  |f Adeel Anjum  |c [S.l.]  |n [s.n.]  |d 2013  |p 1 vol. (188 p.) 
541 | |a Publication de données qui préservent la vie privée pour des données continues et dynamiques : les approches d indexation spatiale et de Bucketisation  |z eng 
606 |3 PPN02801877X  |a Protection de l'information (informatique)  |2 rameau 
606 |3 PPN035198222  |a Exploration de données  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
610 0 |a Bucketisation  |a k-anonymity 
686 |a 004  |2 TEF 
700 1 |3 PPN177403926  |a Anjum  |b Adeel  |f 1982-....  |4 070 
701 1 |3 PPN133954633  |a Gelgon  |b Marc  |4 727 
701 1 |3 PPN070662886  |a Raschia  |b Guillaume  |4 727 
711 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
711 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 295 
711 0 2 |3 PPN134103211  |a École doctorale Sciences et technologies de l'information et mathématiques  |c Nantes  |4 295 
801 3 |a FR  |b Abes  |c 20230206  |g AFNOR 
856 4 |q PDF  |u https://archive.bu.univ-nantes.fr/pollux/show/show?id=f4f0e321-10b7-41ed-a6f6-a57af9f0ddf4  |2 accès au texte intégral de la thèse 
979 |a SCI 
930 |5 441092104:504075292  |b 441092104  |j g 
998 |a 661228