Médiation de données sémantique dans SenPeer, un système pair-à-pair de gestion de données
La société de l'information demande un accès complet et efficace à un ensemble d'informations qui sont souvent hétérogènes etdistribuées. Dans le but d'un partage efficace cette information, plusieurs solutions techniques ont été proposées. L'infrastructure Pair-à-Pair (P2P) est...
Auteurs principaux : | , , |
---|---|
Collectivités auteurs : | , , , |
Format : | Thèse ou mémoire |
Langue : | français |
Titre complet : | Médiation de données sémantique dans SenPeer, un système pair-à-pair de gestion de données / David Célestin Faye; Patrick Valduriez et Mary Teuw Niane, directeurs de thèse |
Publié : |
[S.l.] :
[s.n.]
, 2007 |
Description matérielle : | 1 vol. (141 p.) |
Note de thèse : | Thèse doctorat : Informatique : Nantes : 2007 Thèse doctorat : Informatique : Saint-Louis (Sénégal) : 2007 |
Sujets : | |
Documents associés : | Autre format:
Médiation de données sémantique dans SenPeer, un système pair-à-pair de gestion de données Reproduit comme: Médiation de données sémantique dans SenPeer, un système pair-à-pair de gestion de données |
Particularités de l'exemplaire : | BU Sciences, Ex. 1 : Titre temporairement indisponible à la communication |
Résumé : | La société de l'information demande un accès complet et efficace à un ensemble d'informations qui sont souvent hétérogènes etdistribuées. Dans le but d'un partage efficace cette information, plusieurs solutions techniques ont été proposées. L'infrastructure Pair-à-Pair (P2P) est un paradigme émergent et offrant de nouvelles opportunités pour la mise en place de systèmes distribués à grande échelle. D'autre part, le concept de base de données distribuée a été introduit dans le but d'organiser une collection multiple de bases de données logiquement liées et distribuées sur un réseau d'ordinateurs. Récemment, les systèmes P2P de gestion de données communément appelés PDMS (Peer DataManagement System) ont vu le jour. Ils combinent les avantages des systèmes P2P avec ceux des bases de données distribuées. Dans le but de contribuer à la problématique de la gestion de données dans un contexte P2P, nous proposons le PDMS SenPeer. SenPeer suit une topologie super-pair basée sur l'organisation des pairs en communautés sémantiques en fonction de leurs thèmes d'intérêts. Pour faciliter l'échange de données entre pairs nous établissons des processus de découverte de correspondances sémantiques et de reformulation de requêtes en présence de plusieurs modèles de données. Ces correspondances sémantique, en combinaison avec les schémas des pairs sont à la base d'une topologie sémantique au dessus du réseau physique et utilisée pour un routage efficace des requêtes. Les requêtes sont échangées à travers un format commun d'échange de requête et un processus d'optimisation distribué permet de choisir le meilleur plan d'exécution de la requête en fonction des caractéristiques du PDMS. Une validation expérimentale par la mise en place d'un simulateur permet d'affirmer l'utilité et la performance des techniques proposées. The so-called information society needs a complete and efficient access to the available information which is often heterogeneous and distributed. In order to make information sharing efficient, some technical solutions have been proposed. The concept of distributed database has been introduced in order to organize a collection of multiple and logically bound databases spread across a computer network. The Peer-to-Peer (P2P) infrastructure is an emergent paradigm offering new opportunities for the conception of large scale distributed systems. Recently the P2P data management systems (Peer Data Management System have appeared). They combine the advantages of the P2P systems with those of the distributed databases. In order to contribute to the problem of data management in a P2P context, we propose the SenPeer PDMS. SenPeer is based on a super-peer topology organizing the peers into semantic communities according to their topics of interests. To facilitate data exchange in the presence of heterogeneous schemas and multiple data models, we establish semantic mapping discovery and query reformulation processes. The semantic mappings, in combination with the peer schemas are the basis of a semantic overlay, on top on the underlying physical network and which is used for intelligent query routing. Queries are exchanged through a query exchange format. A distributed optimisation process has the responsibility of finding the best execution plan for the query by taking into account the data distribution and the characteristics of the PDMS. We describe an experimental validation through a simulator to illustrate the feasibility and the performance of the proposed techniques. |
---|---|
Bibliographie : | 118 références bibliographiques |