Réseaux bayésiens et apprentissage ensembliste pour l étude différentielle de réseaux de régulation génétique

Dans les dernières années, les réseaux Bayésiens (RB) sont devenus l'une des méthodes d'apprentissage automatique les plus puissantes permettant de modéliser graphiquement et de manière probabiliste différentes types de systèmes complexes. Un des problèmes communs dans l'apprentissage...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Nguyen Hoai Tuong (Auteur), Leray Philippe (Directeur de thèse), Ramstein Gérard (Membre du jury), Benferhat Salem (Président du jury de soutenance, Rapporteur de la thèse), Piechowiak Sylvain (Rapporteur de la thèse, Membre du jury)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Ecole doctorale associée à la thèse), École polytechnique de l'Université de Nantes (Laboratoire associé à la thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Réseaux bayésiens et apprentissage ensembliste pour l étude différentielle de réseaux de régulation génétique / Hoai Tuong Nguyen; sous la direction de Philippe Leray ; co-encadrant Gérard Ramstein
Publié : 2012
Description matérielle : 1 vol. (123 p.)
Condition d'utilisation et de reproduction : Publication autorisée par le jury
Note de thèse : Thèse de doctorat : Informatique et applications : Nantes : 2012
Sujets :
Particularités de l'exemplaire : BU Sciences, Ex. 1 :
Titre temporairement indisponible à la communication

Description
Résumé : Dans les dernières années, les réseaux Bayésiens (RB) sont devenus l'une des méthodes d'apprentissage automatique les plus puissantes permettant de modéliser graphiquement et de manière probabiliste différentes types de systèmes complexes. Un des problèmes communs dans l'apprentissage de la structure des RB est le problème des données de petites tailles. En effet, le résultat de l'apprentissage est sensible au nombre d'échantillons de données. En apprentissage automatique, les méthodes d'apprentissage ensemblistes telles que le bootstrap ou les algorithmes génétiques sont des méthodes souvent utilisées pour traiter le problème de la pauvreté de données. Toutefois, les méthodes existantes se limitent généralement à la fusion d'un ensemble de modèles, mais ne permettent pas de comparer deux ensembles de modèles. Inspiré par les résultats obtenus par les méthodes ensemblistes, nous proposons une nouvelle méthode basée sur le graphe quasi-essentiel (QEG - Quasi-Essential Graph) et l'utilisation d'un test multiple afin de comparer deux ensembles de RB. Le QEG permet de résumer et de visualiser graphiquement un ensemble de RB. Le test multiple permet de vérifier si les différences entre les deux ensembles de RB sont statistiquement significatives et de déterminer la position de ces différences. L'application sur des données synthétiques et expérimentales a démontré les différents intérêts de la méthode proposée dans la reconstruction des réseaux de régulation génétique et perspectivement dans les autres applications avec les données de petites tailles
ln the recent years, the Bayesian networks (SN) have become one of the most powerful machine learning methods to modeling graphically and probabilistically different kinds of complex systems. One of the common issues in BN structure learning is the small-data problem. ln fact, the result of learning is sensible to sample size of dataset. ln machine learning, the set-based learning methods such as Bootstrap ou genetic algorithms are the often used methods to dealing with the small-data problem. However, the existing methods limit generally to the fusion of a set of models, but do not allow to compare two set of models. Inspired from the obtained results of the set-based methods, we proposed a novel method based on the quasi-essential graph (QEG) and the usage of the multiple testing in order to compare two sets of BN. QEG allows to resume and visualize graphically a set of BN. The multiple testing allows to verify if the differences between two set of BN are statistically significative and to determine the position of the differences. The application on the synthetic and experimental data demonstrated the different interests of proposed method in gene regulatory networks reconstruction and perspectively in the other applications with the small dataset
Variantes de titre : Bayesian networks and set-based learning for the differential study of the gene regulatory networks
Notes : Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (STIM) (Nantes)
Autre(s) contribution(s) : Salem Benferhat (Président du jury) ; Philippe Leray (Examinateurs) ; Sylvain Piechowiak (Rapporteurs)
Bibliographie : Bibliogr. p.109-123