ISSN: 2379-1764
Julien Pelé, Bruck Taddese, Madeline Deniaud, Antoine Garnier, Daniel Henrion, Hervé Abdi et Marie Chabbert
Dans un alignement de séquences multiples, les co-variations de séquences résultent de contraintes structurelles, fonctionnelles et/ou phylogénétiques. De nombreuses méthodes ont été développées pour calculer les scores de co-variation, mais peu d'études ont comparé ces méthodes pour identifier celles qui sont les mieux adaptées à l'analyse de la divergence des familles de protéines. Nous donnons ici un aperçu des méthodes largement utilisées et identifions des règles simples pour la sélection des méthodes appropriées. Plus précisément, nous avons constaté que des méthodes telles que OMES et ELSC, qui privilégient les paires avec une entropie intermédiaire et les réseaux de covariation avec une structure centrale, sont bien adaptées pour révéler des informations évolutives sur la divergence des familles. Appliquées aux récepteurs couplés aux protéines G, ces méthodes soutiennent un modèle d'épistasie de l'évolution des protéines dans lequel, après une mutation clé, la co-évolution de plusieurs résidus était nécessaire pour restaurer et/ou déplacer la fonction des protéines.