Des spectres MS/MS à l'identification des protéines : interprétation des données issues de l'analyse d'un mélange de protéïnes d'un organisme non séquencé
La spectrométrie de masse est une technique utilisée en protéomique pour identifier des protéines inconnues dans un échantillon. Le spectromètre mesure la masse de fragments de la protéine et fournit ainsi des spectres expérimentaux qui sont des représentations, sous forme de séries de pics, de la p...
Auteurs principaux : | , , |
---|---|
Collectivités auteurs : | , , |
Format : | Thèse ou mémoire |
Langue : | français |
Titre complet : | Des spectres MS/MS à l'identification des protéines : interprétation des données issues de l'analyse d'un mélange de protéïnes d'un organisme non séquencé / Freddy Cliquet; sous la direction de Guillaume Fertin ; co-encadrant Dominique Tessier |
Publié : |
Nantes :
Université de Nantes
, 2011 |
Accès en ligne : |
Accès Nantes Université
|
Note de thèse : | Reproduction de : Thèse de doctorat : Informatique : Nantes : 2011 |
Sujets : | |
Documents associés : | Reproduction de:
Des spectres MS/MS à l'identification des protéines |
Résumé : | La spectrométrie de masse est une technique utilisée en protéomique pour identifier des protéines inconnues dans un échantillon. Le spectromètre mesure la masse de fragments de la protéine et fournit ainsi des spectres expérimentaux qui sont des représentations, sous forme de séries de pics, de la présence de ces différents fragments. En étudiant ces spectres, nous espérons pouvoir identifier la protéine d origine en la retrouvant dans une banque. L objectif de cette thèse est de proposer de nouvelles méthodes permettant d étudier ces spectres. Cependant, ces méthodes doivent fonctionner sur des organismes non séquencés. Dans ce cas particulier, nous ne retrouverons pas exactement ces protéines dans la banque, mais uniquement des protéines qui y ressemblent. Nous proposons tout d abord un nouvel algorithme dit de comparaison de spectres : PacketSpectralAlignment. Cet algorithme permet de comparer des spectres expérimentaux à des spectres créés à partir des données contenues dans la banque, et ce, même en présence de modifications. Cette comparaison permet l association de chacun des spectres à un peptide de cette banque. Ensuite, nous détaillerons différents prétraitements et filtrages permettant d améliorer l exploitation de notre nouvel algorithme. Tous ces éléments sont intégrés dans une plate-forme intitulé SIFpackets. Enfin, nous validons les résultats de PacketSpectralAlignment ainsi que de SIFpackets sur différents jeux de données réelles. Mass spectrometry is a general method used in proteomics to identify unknown proteins in a sample. The mass spectrometer measures the masses of several protein s fragments and provide spectra. A spectrum is a series of peaks that indicate the presence of those fragments. By studying these spectra, we aim at retrieving the analyzed protein in a reference databank. In this thesis, we propose a new method to study these spectra. However, our solution must be able to work on proteins coming from unsequenced species, which means that we can t find exactly the same proteins in the databank, only similar ones. At first, we propose a new spectra comparison algorithm: PacketSpectralAlignment. This algorithm allows to compare experimental spectra produced by a mass spectrometer to spectra created from the reference databank data in presence of modifications. This comparison allows to associate to each spectrum, a peptide from the databank. Then, we explain several preprocessing and filtering methods that enhance the results of our new algorithm. All of those methods are used in the SIFpackets framework. Finally, we validate PacketSpectralAlignment and SIFpackets results using several experimental datasets. |
---|---|
Variantes de titre : | From MS/MS spectra to protein identification : interpretation of data from shotgun protein analysis in an unsequenced organism |
Bibliographie : | Références bibliographiques |