Exploring new applications of a structural alphabet in protein structure analyses

Les alphabets structuraux sont des collections de motifs structuraux répétés dans les structures de protéines. Durant ma thèse, j'ai utilisé l'un d'eux, les blocs protéiques (BPs), pour diverses applications comme la prédiction, la comparaison et l'analyse de structures de protéi...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Vetrivel Iyanar (Auteur), Offmann Bernard (Directeur de thèse), Cadet Frédéric (Directeur de thèse), Etchebest Catherine (Président du jury de soutenance), Camproux Anne-Claude (Rapporteur de la thèse), Narayanaswamy Srinivasan (Membre du jury), Martin Juliette (Membre du jury)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), École doctorale Biologie-Santé Nantes (Ecole doctorale associée à la thèse), Université Bretagne Loire 2016-2019 (Autre partenaire associé à la thèse), Unité en sciences biologiques et biotechnologies Nantes (Laboratoire associé à la thèse)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : Exploring new applications of a structural alphabet in protein structure analyses / Iyanar Vetrivel; sous la direction de Bernard Offmann et de Frédéric Cadet
Publié : 2017
Accès en ligne : Accès Nantes Université
Note sur l'URL : Accès au texte intégral
Note de thèse : Thèse de doctorat : Aspects moléculaires et cellulaires de la biologie : Nantes : 2017
Sujets :
Description
Résumé : Les alphabets structuraux sont des collections de motifs structuraux répétés dans les structures de protéines. Durant ma thèse, j'ai utilisé l'un d'eux, les blocs protéiques (BPs), pour diverses applications comme la prédiction, la comparaison et l'analyse de structures de protéines. J'ai d'abord étudié les variations structurales observées au sein de structures ayant des séquences protéiques identiques et au cours de simulations de dynamique moléculaire. Les résultats de ces analyses ont été synthétisés sous la forme de matrices de substitution et ont montré des similitudes surprenantes avec les précédentes matrices établies pour les protéines homologues ou les ensembles RMN. La méthode kPRED qui permet de prédire le squelette des protéines sous forme de BPs a été amélioré en prenant en compte les structures locales voisines. La nouvelle version privilégie aussi les informations provenant des protéines homologues lorsqu'elles sont disponibles, atteignant une précision moyenne de 66,3% sur un jeu de données test. J'ai aussi étendu la portée de la base de données PENTAdb pour couvrir l'ensemble des structures de la PDB. Je montre que l'effet de cette augmentation de 950% dans le contenu de PENTAdb améliore notre compréhension de la relation séquence-structure au niveau d'un pentapeptide. J'ai également utilisé PB-ALIGN, un outil de comparaison rapide et efficace de structures des protéines, pour comparer toutes les structures protéiques dans la PDB entre elles et pour étudier les similitudes structurales. J'ai généré une grande collection de données d'alignement et j'explore son usage pour l'annotation fonctionnelle et l'identification de possibles relations évolutives.
Structural motifs found in protein structures. They help in approximating protein structure as a 1D string with minimal loss of structural information. Here I have employed a widely used structural alphabet called Protein Blocks (PB) for various applications like predicting, comparing and analyzing protein structures. PBs were used to study the structural variations in proteins with identical primary structure and also during the course of molecular dynamics (MD) simulations. The results from these analyses were summarized in the form of substitution matrices and showed striking similarities to previously established matrices for homologous proteins and NMR ensembles. I improved kPRED, a knowledge-based prediction of protein backbone in terms of PBs, by taking into consideration the neighboring local structures. The new version of the algorithm also privileges structural information from homologous proteins when available reaching an average accuracy of 66.3% on a benchmark dataset. The scope of the PENTAdb database has been expanded to cover the entire protein structure space in an automated manner. I show that the effect of this 950% increase in the contents of PENTAdb improves our understanding of the sequence-structure relationship at the pentapeptide level. I also used PB-ALIGN, a fast and efficient protein structure comparison tool, to compare all protein structures in PDB in an all-vs-all manner and to investigate PB-based structural similarities. This generated a huge collection of alignment data and I discuss its use for functional annotation and identification of possible evolutionary relationships.
Variantes de titre : Nouvelles applications autour de l'usage d'un alphabet structural pour l'analyse des structures des protéines
Notes : Titre provenant de l'écran-titre
Ecole(s) Doctorale(s) : École doctorale Biologie-Santé (Rennes)
Partenaire(s) de recherche : Université Bretagne Loire (COMUE), Unité de Fonctionnalité et Ingénierie des Protéines (Nantes) (Laboratoire)
Autre(s) contribution(s) : Catherine Etchebest (Président du jury) ; Srinivasan Narayanaswamy, Juliette Martin (Membre(s) du jury) ; Anne-Claude Camproux (Rapporteur(s))
Configuration requise : Configuration requise : un logiciel capable de lire un fichier au format : PDF