Publication de données personnelles respectueuse de la vie privée : une démarche fondée sur le co-clustering /

Il y a une forte demande économique et citoyenne pour l’ouverture des données individuelles. Cependant, la publication de telles données représente un risque pour les individus qui y sont représentés. Cette thèse s’intéresse à la problématique de l’anonymisation de tables de données multidimensionne...

Description complète

Enregistré dans:
Détails bibliographiques
Auteur principal : Benkhelif, Tarek (1991-....) (Auteur)
Collectivités auteurs : Université de Nantes (1962-2021) (Organisme de soutenance), École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) (Ecole doctorale associée à la thèse), Université Bretagne Loire (2016-2019) (Autre partenaire associé à la thèse), Laboratoire des Sciences du Numérique de Nantes (Laboratoire associé à la thèse)
Autres auteurs : Gelgon, Marc (Directeur de thèse), Raschia, Guillaume (Directeur de thèse), Laurent, Maryline (19..-....) (Président du jury de soutenance), Rosenberger, Christophe (1973-....) (Rapporteur de la thèse), Nguyen, Benjamin (1976-....) (Rapporteur de la thèse), Gançarski, Pierre (1959-....) (Opposant, Membre du jury)
Format : Thèse Électronique eBook
Langue :français
Sujets :
Accès en ligne :Accès au texte intégral
https://archive.bu.univ-nantes.fr/pollux/show.action?id=1965a4b2-5b97-4d99-aeb1-2e624b89005d
http://www.theses.fr/2018NANT4070/abes

MARC

LEADER 00000cmm a2200000 i 4500
001 in00000557636
005 20231213034931.0
007 cr|uuu---uuuuu
008 190923s2018||||fr ||||f|||d ||||||fre d
024 7 |a 2018NANT4070  |2 FRnnt 
035 |a (OCoLC)1371478931 
035 |a STAR114969 
035 |a (PPN)238105652 
040 |a ABES  |b fre  |e AFNOR 
041 0 |a fre  |b fre  |b eng  |2 639-2 
084 |a 004.  |2 TEF 
100 1 |0 (IdRef)238097676  |1 http://www.idref.fr/238097676/id  |a Benkhelif, Tarek  |d (1991-....).  |4 aut.  |e Auteur 
242 1 0 |a Privacy preserving microdata publishing.  |y eng 
245 1 0 |a Publication de données personnelles respectueuse de la vie privée :  |b une démarche fondée sur le co-clustering /  |c Tarek Benkhelif ; sous la direction de Marc Gelgon et de Guillaume Raschia. 
256 |a Données textuelles. 
264 0 |c 2018. 
336 |b txt  |2 rdacontent 
337 |b c  |2 rdamedia 
337 |b b  |2 isbdmedia 
338 |b ceb  |2 RDAfrCarrier 
500 |a Titre provenant de l'écran-titre. 
502 |a Thèse de doctorat : Informatique : Nantes : 2018 
520 |a Il y a une forte demande économique et citoyenne pour l’ouverture des données individuelles. Cependant, la publication de telles données représente un risque pour les individus qui y sont représentés. Cette thèse s’intéresse à la problématique de l’anonymisation de tables de données multidimensionnelles contenant des données individuelles dans un objectif de publication. On se concentrera plus particulièrement sur deux familles d’approches pour l’anonymisation: la première vise à fondre chaque individu dans un groupe d’individus, la deuxième est basée sur l’ajout d’un bruit perturbateur aux données originales. Deux nouvelles approches sont développées dans le cadre de l’anonymisation par groupe, elles consistent à agréger les données à l’aide d’une technique de coclustering puis à utiliser le modèle produit, pour générer des enregistrements synthétiques, dans le cas de la première solution. La deuxième proposition quant à elle, cherche à atteindre le formalisme du k-anonymat. Enfin, nous présentons DPCocGen un nouvel algorithme d’anonymisation respectueux de la confidentialité différentielle. Tout d'abord, un partitionnement sur les domaines est utilisé pour générer un histogramme multidimensionnel bruité, un co-clustering multidimensionnel est ensuite effectué sur l'histogramme bruité résultant en un schéma de partitionnement. Enfin, le schéma obtenu est utilisé pour partitionner les données originales de manière différentiellement privée. Des individus synthétiques peuvent alors être tirés des partitions. 
520 |a There is a strong economic and civic demand for the opening of individual data. However, the publication of such data poses a risk to the individuals represented in it. This thesis focuses on the problem of anonymizing multidimensional data tables containing individual data for publishing purposes. In particular, two data anonymization approaches families will be focused on: the first aims to merge each individual into a group of individuals, the second is based on the addition of disruptive noise to the original data. Two new approaches are developed in the context of group anonymization. They aggregate the data using a co-clustering technique and then use the produced model, to generate synthetic records, in the case of the first solution. While the second proposal seeks to achieve the formalism of k-anonymity. Finally, we present a new anonymization algorithm “DPCocGen” that ensures differential privacy. First, a data-independent partitioning on the domains is used to generate a perturbed multidimensional histogram, a multidimensional co-clustering is then performed on the noisy histogram resulting in a partitioning scheme. Finally, the resulting schema is used to partition the original data in a differentially private way. Synthetic individuals can then be drawn from the partitions. 
538 |a Configuration requise : un logiciel capable de lire un fichier au format : PDF. 
550 |a Ecole(s) Doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) 
550 |a Partenaire(s) de recherche : Université Bretagne Loire (COMUE), Laboratoire des Sciences du Numérique de Nantes (Laboratoire) 
550 |a Autre(s) contribution(s) : Maryline Laurent (Président du jury) ; Pierre Gançarski (Membre(s) du jury) ; Christophe Rosenberger, Benjamin Nguyen (Rapporteur(s)) 
650 7 |0 (IdRef)027701166  |1 http://www.idref.fr/027701166/id  |a Vie privée.  |2 ram 
650 7 |0 (IdRef)02801877X  |1 http://www.idref.fr/02801877X/id  |a Protection de l'information (informatique).  |2 ram 
653 |a K-anonymat 
655 7 |0 (IdRef)027253139  |1 http://www.idref.fr/027253139/id  |a Thèses et écrits académiques.  |2 ram 
700 1 |0 (IdRef)133954633  |1 http://www.idref.fr/133954633/id  |a Gelgon, Marc.  |4 ths.  |e Directeur de thèse 
700 1 |0 (IdRef)070662886  |1 http://www.idref.fr/070662886/id  |a Raschia, Guillaume.  |4 ths.  |e Directeur de thèse 
700 1 |0 (IdRef)079483658  |1 http://www.idref.fr/079483658/id  |a Laurent, Maryline  |d (19..-....).  |4 956.  |e Président du jury de soutenance 
700 1 |0 (IdRef)122682505  |1 http://www.idref.fr/122682505/id  |a Rosenberger, Christophe  |d (1973-....).  |4 958.  |e Rapporteur de la thèse 
700 1 |0 (IdRef)07790821X  |1 http://www.idref.fr/07790821X/id  |a Nguyen, Benjamin  |d (1976-....).  |4 958.  |e Rapporteur de la thèse 
700 1 |0 (IdRef)033775958  |1 http://www.idref.fr/033775958/id  |a Gançarski, Pierre  |d (1959-....).  |4 opn.  |e Membre du jury 
710 2 |0 (IdRef)026403447  |1 http://www.idref.fr/026403447/id  |a Université de Nantes (1962-2021).  |4 dgg.  |e Organisme de soutenance 
710 2 |0 (IdRef)204770424  |1 http://www.idref.fr/204770424/id  |a École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes).  |4 996.  |e Ecole doctorale associée à la thèse 
710 2 |0 (IdRef)191639044  |1 http://www.idref.fr/191639044/id  |a Université Bretagne Loire (2016-2019).  |4 985.  |e Autre partenaire associé à la thèse 
710 2 |0 (IdRef)203637585  |1 http://www.idref.fr/203637585/id  |a Laboratoire des Sciences du Numérique de Nantes.  |4 981.  |e Laboratoire associé à la thèse 
856 |q PDF  |s 4024494  |u http://www.theses.fr/2018NANT4070/document  |z Accès au texte intégral 
856 |u https://archive.bu.univ-nantes.fr/pollux/show.action?id=1965a4b2-5b97-4d99-aeb1-2e624b89005d 
856 |u http://www.theses.fr/2018NANT4070/abes 
886 2 |2 unimarc  |a 181  |a i#  |b xxxe## 
930 |5 441099901:778928519  |b 441099901  |j g 
991 |5 441099901:778928519  |a exemplaire créé automatiquement par STAR 
999 f f |i 9cb8b2b4-debb-539f-a033-a1569e536010  |s 80e53406-133f-5383-9d98-c0571234044f  |t 0 
952 f f |p P0 Non empruntable  |a Nantes Université  |b Numérique  |c Bibliothèque numérique  |d Thèses de doctorat  |t 1  |h Locale  |i Indéterminé  |m 2018NANT4070 

Notice dans l'index de recherche

_version_ 1814874534977732608
author Benkhelif, Tarek (1991-....)
author2 Gelgon, Marc
Raschia, Guillaume
Laurent, Maryline (19..-....)
Rosenberger, Christophe (1973-....)
Nguyen, Benjamin (1976-....)
Gançarski, Pierre (1959-....)
Gançarski, Pierre (1959-....)
author2_role ths
ths
Président du jury de soutenance
Rapporteur de la thèse
Rapporteur de la thèse
opn
Membre du jury
author2_variant m g mg
g r gr
m l ml
c r cr
b n bn
p g pg
p g pg
author_corporate Université de Nantes (1962-2021)
École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Université Bretagne Loire (2016-2019)
Laboratoire des Sciences du Numérique de Nantes
author_corporate_role Organisme de soutenance
Ecole doctorale associée à la thèse
Autre partenaire associé à la thèse
Laboratoire associé à la thèse
author_facet Benkhelif, Tarek (1991-....)
Gelgon, Marc
Raschia, Guillaume
Laurent, Maryline (19..-....)
Rosenberger, Christophe (1973-....)
Nguyen, Benjamin (1976-....)
Gançarski, Pierre (1959-....)
Gançarski, Pierre (1959-....)
Université de Nantes (1962-2021)
École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Université Bretagne Loire (2016-2019)
Laboratoire des Sciences du Numérique de Nantes
author_role aut
author_sort Benkhelif, Tarek (1991-....)
author_variant t b tb
building Bibliothèque numérique
campus_str_mv Numérique
collection Thèses de doctorat
ctrlnum (OCoLC)1371478931
STAR114969
(PPN)238105652
format Thesis
Electronic
eBook
fullrecord {"leader":"00000cmm a2200000 i 4500","fields":[{"001":"in00000557636"},{"005":"20231213034931.0"},{"007":"cr|uuu---uuuuu"},{"008":"190923s2018||||fr ||||f|||d ||||||fre d"},{"024":{"subfields":[{"a":"2018NANT4070"},{"2":"FRnnt"}],"ind1":"7","ind2":" "}},{"035":{"subfields":[{"a":"(OCoLC)1371478931"}],"ind1":" ","ind2":" "}},{"035":{"subfields":[{"a":"STAR114969"}],"ind1":" ","ind2":" "}},{"035":{"subfields":[{"a":"(PPN)238105652"}],"ind1":" ","ind2":" "}},{"040":{"subfields":[{"a":"ABES"},{"b":"fre"},{"e":"AFNOR"}],"ind1":" ","ind2":" "}},{"041":{"subfields":[{"a":"fre"},{"b":"fre"},{"b":"eng"},{"2":"639-2"}],"ind1":"0","ind2":" "}},{"084":{"subfields":[{"a":"004."},{"2":"TEF"}],"ind1":" ","ind2":" "}},{"100":{"subfields":[{"0":"(IdRef)238097676"},{"1":"http://www.idref.fr/238097676/id"},{"a":"Benkhelif, Tarek"},{"d":"(1991-....)."},{"4":"aut."},{"e":"Auteur"}],"ind1":"1","ind2":" "}},{"242":{"subfields":[{"a":"Privacy preserving microdata publishing."},{"y":"eng"}],"ind1":"1","ind2":"0"}},{"245":{"subfields":[{"a":"Publication de données personnelles respectueuse de la vie privée :"},{"b":"une démarche fondée sur le co-clustering /"},{"c":"Tarek Benkhelif ; sous la direction de Marc Gelgon et de Guillaume Raschia."}],"ind1":"1","ind2":"0"}},{"256":{"subfields":[{"a":"Données textuelles."}],"ind1":" ","ind2":" "}},{"264":{"subfields":[{"c":"2018."}],"ind1":" ","ind2":"0"}},{"336":{"subfields":[{"b":"txt"},{"2":"rdacontent"}],"ind1":" ","ind2":" "}},{"337":{"subfields":[{"b":"c"},{"2":"rdamedia"}],"ind1":" ","ind2":" "}},{"337":{"subfields":[{"b":"b"},{"2":"isbdmedia"}],"ind1":" ","ind2":" "}},{"338":{"subfields":[{"b":"ceb"},{"2":"RDAfrCarrier"}],"ind1":" ","ind2":" "}},{"500":{"subfields":[{"a":"Titre provenant de l'écran-titre."}],"ind1":" ","ind2":" "}},{"502":{"subfields":[{"a":"Thèse de doctorat : Informatique : Nantes : 2018"}],"ind1":" ","ind2":" "}},{"520":{"subfields":[{"a":"Il y a une forte demande économique et citoyenne pour l\u2019ouverture des données individuelles. Cependant, la publication de telles données représente un risque pour les individus qui y sont représentés. Cette thèse s\u2019intéresse à la problématique de l\u2019anonymisation de tables de données multidimensionnelles contenant des données individuelles dans un objectif de publication. On se concentrera plus particulièrement sur deux familles d\u2019approches pour l\u2019anonymisation: la première vise à fondre chaque individu dans un groupe d\u2019individus, la deuxième est basée sur l\u2019ajout d\u2019un bruit perturbateur aux données originales. Deux nouvelles approches sont développées dans le cadre de l\u2019anonymisation par groupe, elles consistent à agréger les données à l\u2019aide d\u2019une technique de coclustering puis à utiliser le modèle produit, pour générer des enregistrements synthétiques, dans le cas de la première solution. La deuxième proposition quant à elle, cherche à atteindre le formalisme du k-anonymat. Enfin, nous présentons DPCocGen un nouvel algorithme d\u2019anonymisation respectueux de la confidentialité différentielle. Tout d'abord, un partitionnement sur les domaines est utilisé pour générer un histogramme multidimensionnel bruité, un co-clustering multidimensionnel est ensuite effectué sur l'histogramme bruité résultant en un schéma de partitionnement. Enfin, le schéma obtenu est utilisé pour partitionner les données originales de manière différentiellement privée. Des individus synthétiques peuvent alors être tirés des partitions."}],"ind1":" ","ind2":" "}},{"520":{"subfields":[{"a":"There is a strong economic and civic demand for the opening of individual data. However, the publication of such data poses a risk to the individuals represented in it. This thesis focuses on the problem of anonymizing multidimensional data tables containing individual data for publishing purposes. In particular, two data anonymization approaches families will be focused on: the first aims to merge each individual into a group of individuals, the second is based on the addition of disruptive noise to the original data. Two new approaches are developed in the context of group anonymization. They aggregate the data using a co-clustering technique and then use the produced model, to generate synthetic records, in the case of the first solution. While the second proposal seeks to achieve the formalism of k-anonymity. Finally, we present a new anonymization algorithm \u201cDPCocGen\u201d that ensures differential privacy. First, a data-independent partitioning on the domains is used to generate a perturbed multidimensional histogram, a multidimensional co-clustering is then performed on the noisy histogram resulting in a partitioning scheme. Finally, the resulting schema is used to partition the original data in a differentially private way. Synthetic individuals can then be drawn from the partitions."}],"ind1":" ","ind2":" "}},{"538":{"subfields":[{"a":"Configuration requise : un logiciel capable de lire un fichier au format : PDF."}],"ind1":" ","ind2":" "}},{"550":{"subfields":[{"a":"Ecole(s) Doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)"}],"ind1":" ","ind2":" "}},{"550":{"subfields":[{"a":"Partenaire(s) de recherche : Université Bretagne Loire (COMUE), Laboratoire des Sciences du Numérique de Nantes (Laboratoire)"}],"ind1":" ","ind2":" "}},{"550":{"subfields":[{"a":"Autre(s) contribution(s) : Maryline Laurent (Président du jury) ; Pierre Gançarski (Membre(s) du jury) ; Christophe Rosenberger, Benjamin Nguyen (Rapporteur(s))"}],"ind1":" ","ind2":" "}},{"650":{"subfields":[{"0":"(IdRef)027701166"},{"1":"http://www.idref.fr/027701166/id"},{"a":"Vie privée."},{"2":"ram"}],"ind1":" ","ind2":"7"}},{"650":{"subfields":[{"0":"(IdRef)02801877X"},{"1":"http://www.idref.fr/02801877X/id"},{"a":"Protection de l'information (informatique)."},{"2":"ram"}],"ind1":" ","ind2":"7"}},{"653":{"subfields":[{"a":"K-anonymat"}],"ind1":" ","ind2":" "}},{"655":{"subfields":[{"0":"(IdRef)027253139"},{"1":"http://www.idref.fr/027253139/id"},{"a":"Thèses et écrits académiques."},{"2":"ram"}],"ind1":" ","ind2":"7"}},{"700":{"subfields":[{"0":"(IdRef)133954633"},{"1":"http://www.idref.fr/133954633/id"},{"a":"Gelgon, Marc."},{"4":"ths."},{"e":"Directeur de thèse"}],"ind1":"1","ind2":" "}},{"700":{"subfields":[{"0":"(IdRef)070662886"},{"1":"http://www.idref.fr/070662886/id"},{"a":"Raschia, Guillaume."},{"4":"ths."},{"e":"Directeur de thèse"}],"ind1":"1","ind2":" "}},{"700":{"subfields":[{"0":"(IdRef)079483658"},{"1":"http://www.idref.fr/079483658/id"},{"a":"Laurent, Maryline"},{"d":"(19..-....)."},{"4":"956."},{"e":"Président du jury de soutenance"}],"ind1":"1","ind2":" "}},{"700":{"subfields":[{"0":"(IdRef)122682505"},{"1":"http://www.idref.fr/122682505/id"},{"a":"Rosenberger, Christophe"},{"d":"(1973-....)."},{"4":"958."},{"e":"Rapporteur de la thèse"}],"ind1":"1","ind2":" "}},{"700":{"subfields":[{"0":"(IdRef)07790821X"},{"1":"http://www.idref.fr/07790821X/id"},{"a":"Nguyen, Benjamin"},{"d":"(1976-....)."},{"4":"958."},{"e":"Rapporteur de la thèse"}],"ind1":"1","ind2":" "}},{"700":{"subfields":[{"0":"(IdRef)033775958"},{"1":"http://www.idref.fr/033775958/id"},{"a":"Gançarski, Pierre"},{"d":"(1959-....)."},{"4":"opn."},{"e":"Membre du jury"}],"ind1":"1","ind2":" "}},{"710":{"subfields":[{"0":"(IdRef)026403447"},{"1":"http://www.idref.fr/026403447/id"},{"a":"Université de Nantes (1962-2021)."},{"4":"dgg."},{"e":"Organisme de soutenance"}],"ind1":"2","ind2":" "}},{"710":{"subfields":[{"0":"(IdRef)204770424"},{"1":"http://www.idref.fr/204770424/id"},{"a":"École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)."},{"4":"996."},{"e":"Ecole doctorale associée à la thèse"}],"ind1":"2","ind2":" "}},{"710":{"subfields":[{"0":"(IdRef)191639044"},{"1":"http://www.idref.fr/191639044/id"},{"a":"Université Bretagne Loire (2016-2019)."},{"4":"985."},{"e":"Autre partenaire associé à la thèse"}],"ind1":"2","ind2":" "}},{"710":{"subfields":[{"0":"(IdRef)203637585"},{"1":"http://www.idref.fr/203637585/id"},{"a":"Laboratoire des Sciences du Numérique de Nantes."},{"4":"981."},{"e":"Laboratoire associé à la thèse"}],"ind1":"2","ind2":" "}},{"856":{"subfields":[{"q":"PDF"},{"s":"4024494"},{"u":"http://www.theses.fr/2018NANT4070/document"},{"z":"Accès au texte intégral"}],"ind1":" ","ind2":" "}},{"856":{"subfields":[{"u":"https://archive.bu.univ-nantes.fr/pollux/show.action?id=1965a4b2-5b97-4d99-aeb1-2e624b89005d"}],"ind1":" ","ind2":" "}},{"856":{"subfields":[{"u":"http://www.theses.fr/2018NANT4070/abes"}],"ind1":" ","ind2":" "}},{"886":{"subfields":[{"2":"unimarc"},{"a":"181"},{"a":"i#"},{"b":"xxxe##"}],"ind1":"2","ind2":" "}},{"930":{"subfields":[{"5":"441099901:778928519"},{"b":"441099901"},{"j":"g"}],"ind1":" ","ind2":" "}},{"991":{"subfields":[{"5":"441099901:778928519"},{"a":"exemplaire créé automatiquement par STAR"}],"ind1":" ","ind2":" "}},{"999":{"subfields":[{"i":"9cb8b2b4-debb-539f-a033-a1569e536010"},{"s":"80e53406-133f-5383-9d98-c0571234044f"},{"t":"0"}],"ind1":"f","ind2":"f"}},{"952":{"subfields":[{"p":"P0 Non empruntable"},{"a":"Nantes Université"},{"b":"Numérique"},{"c":"Bibliothèque numérique"},{"d":"Thèses de doctorat"},{"t":"1"},{"h":"Locale"},{"i":"Indéterminé"},{"m":"2018NANT4070"}],"ind1":"f","ind2":"f"}}]}
genre (IdRef)027253139 http://www.idref.fr/027253139/id Thèses et écrits académiques. ram
genre_facet Thèses et écrits académiques.
id in00000557636
illustrated Not Illustrated
institution Nantes Université
language French
oclc_num 1371478931
online_boolean
record_format marc
spelling (IdRef)238097676 http://www.idref.fr/238097676/id Benkhelif, Tarek (1991-....). aut. Auteur
Privacy preserving microdata publishing. eng
Publication de données personnelles respectueuse de la vie privée : une démarche fondée sur le co-clustering / Tarek Benkhelif ; sous la direction de Marc Gelgon et de Guillaume Raschia.
Données textuelles.
2018.
txt rdacontent
c rdamedia
b isbdmedia
ceb RDAfrCarrier
Titre provenant de l'écran-titre.
Thèse de doctorat : Informatique : Nantes : 2018
Il y a une forte demande économique et citoyenne pour l’ouverture des données individuelles. Cependant, la publication de telles données représente un risque pour les individus qui y sont représentés. Cette thèse s’intéresse à la problématique de l’anonymisation de tables de données multidimensionnelles contenant des données individuelles dans un objectif de publication. On se concentrera plus particulièrement sur deux familles d’approches pour l’anonymisation: la première vise à fondre chaque individu dans un groupe d’individus, la deuxième est basée sur l’ajout d’un bruit perturbateur aux données originales. Deux nouvelles approches sont développées dans le cadre de l’anonymisation par groupe, elles consistent à agréger les données à l’aide d’une technique de coclustering puis à utiliser le modèle produit, pour générer des enregistrements synthétiques, dans le cas de la première solution. La deuxième proposition quant à elle, cherche à atteindre le formalisme du k-anonymat. Enfin, nous présentons DPCocGen un nouvel algorithme d’anonymisation respectueux de la confidentialité différentielle. Tout d'abord, un partitionnement sur les domaines est utilisé pour générer un histogramme multidimensionnel bruité, un co-clustering multidimensionnel est ensuite effectué sur l'histogramme bruité résultant en un schéma de partitionnement. Enfin, le schéma obtenu est utilisé pour partitionner les données originales de manière différentiellement privée. Des individus synthétiques peuvent alors être tirés des partitions.
There is a strong economic and civic demand for the opening of individual data. However, the publication of such data poses a risk to the individuals represented in it. This thesis focuses on the problem of anonymizing multidimensional data tables containing individual data for publishing purposes. In particular, two data anonymization approaches families will be focused on: the first aims to merge each individual into a group of individuals, the second is based on the addition of disruptive noise to the original data. Two new approaches are developed in the context of group anonymization. They aggregate the data using a co-clustering technique and then use the produced model, to generate synthetic records, in the case of the first solution. While the second proposal seeks to achieve the formalism of k-anonymity. Finally, we present a new anonymization algorithm “DPCocGen” that ensures differential privacy. First, a data-independent partitioning on the domains is used to generate a perturbed multidimensional histogram, a multidimensional co-clustering is then performed on the noisy histogram resulting in a partitioning scheme. Finally, the resulting schema is used to partition the original data in a differentially private way. Synthetic individuals can then be drawn from the partitions.
Configuration requise : un logiciel capable de lire un fichier au format : PDF.
Ecole(s) Doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Université Bretagne Loire (COMUE), Laboratoire des Sciences du Numérique de Nantes (Laboratoire)
Autre(s) contribution(s) : Maryline Laurent (Président du jury) ; Pierre Gançarski (Membre(s) du jury) ; Christophe Rosenberger, Benjamin Nguyen (Rapporteur(s))
(IdRef)027701166 http://www.idref.fr/027701166/id Vie privée. ram
(IdRef)02801877X http://www.idref.fr/02801877X/id Protection de l'information (informatique). ram
K-anonymat
(IdRef)027253139 http://www.idref.fr/027253139/id Thèses et écrits académiques. ram
(IdRef)133954633 http://www.idref.fr/133954633/id Gelgon, Marc. ths. Directeur de thèse
(IdRef)070662886 http://www.idref.fr/070662886/id Raschia, Guillaume. ths. Directeur de thèse
(IdRef)079483658 http://www.idref.fr/079483658/id Laurent, Maryline (19..-....). 956. Président du jury de soutenance
(IdRef)122682505 http://www.idref.fr/122682505/id Rosenberger, Christophe (1973-....). 958. Rapporteur de la thèse
(IdRef)07790821X http://www.idref.fr/07790821X/id Nguyen, Benjamin (1976-....). 958. Rapporteur de la thèse
(IdRef)033775958 http://www.idref.fr/033775958/id Gançarski, Pierre (1959-....). opn. Membre du jury
(IdRef)026403447 http://www.idref.fr/026403447/id Université de Nantes (1962-2021). dgg. Organisme de soutenance
(IdRef)204770424 http://www.idref.fr/204770424/id École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes). 996. Ecole doctorale associée à la thèse
(IdRef)191639044 http://www.idref.fr/191639044/id Université Bretagne Loire (2016-2019). 985. Autre partenaire associé à la thèse
(IdRef)203637585 http://www.idref.fr/203637585/id Laboratoire des Sciences du Numérique de Nantes. 981. Laboratoire associé à la thèse
PDF 4024494 http://www.theses.fr/2018NANT4070/document Accès au texte intégral
https://archive.bu.univ-nantes.fr/pollux/show.action?id=1965a4b2-5b97-4d99-aeb1-2e624b89005d
http://www.theses.fr/2018NANT4070/abes
unimarc 181 i# xxxe##
spellingShingle Benkhelif, Tarek (1991-....)
Publication de données personnelles respectueuse de la vie privée : une démarche fondée sur le co-clustering /
(IdRef)027701166 http://www.idref.fr/027701166/id Vie privée. ram
(IdRef)02801877X http://www.idref.fr/02801877X/id Protection de l'information (informatique). ram
K-anonymat
title Publication de données personnelles respectueuse de la vie privée : une démarche fondée sur le co-clustering /
title_auth Publication de données personnelles respectueuse de la vie privée : une démarche fondée sur le co-clustering /
title_full Publication de données personnelles respectueuse de la vie privée : une démarche fondée sur le co-clustering / Tarek Benkhelif ; sous la direction de Marc Gelgon et de Guillaume Raschia.
title_fullStr Publication de données personnelles respectueuse de la vie privée : une démarche fondée sur le co-clustering / Tarek Benkhelif ; sous la direction de Marc Gelgon et de Guillaume Raschia.
title_full_unstemmed Publication de données personnelles respectueuse de la vie privée : une démarche fondée sur le co-clustering / Tarek Benkhelif ; sous la direction de Marc Gelgon et de Guillaume Raschia.
title_short Publication de données personnelles respectueuse de la vie privée :
title_sort publication de donnees personnelles respectueuse de la vie privee une demarche fondee sur le co clustering
title_sub une démarche fondée sur le co-clustering /
topic (IdRef)027701166 http://www.idref.fr/027701166/id Vie privée. ram
(IdRef)02801877X http://www.idref.fr/02801877X/id Protection de l'information (informatique). ram
K-anonymat
topic_facet Vie privée.
Protection de l'information (informatique).
url http://www.theses.fr/2018NANT4070/document
https://archive.bu.univ-nantes.fr/pollux/show.action?id=1965a4b2-5b97-4d99-aeb1-2e624b89005d
http://www.theses.fr/2018NANT4070/abes
work_keys_str_mv AT benkheliftarek publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering
AT gelgonmarc publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering
AT raschiaguillaume publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering
AT laurentmaryline publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering
AT rosenbergerchristophe publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering
AT nguyenbenjamin publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering
AT gancarskipierre publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering
AT universitedenantes19622021 publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering
AT ecoledoctoralemathematiquesetsciencesettechnologiesdelinformationetdelacommunicationrennes publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering
AT universitebretagneloire20162019 publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering
AT laboratoiredessciencesdunumeriquedenantes publicationdedonneespersonnellesrespectueusedelaviepriveeunedemarchefondeesurlecoclustering