ISSN: 2376-130X
Runyu Jing, Yuelong Wang, Yiming Wu, Yongpan Hua, Xu Dai1 et Menglong Li
Le facteur B, également appelé facteur Debye-Waller ou facteur de température, est un descripteur de la flexibilité des protéines et est couramment utilisé dans les fichiers au format PDB (Protein Data Bank). Un facteur B peut être mesuré à partir d'un cristal de protéine par diffusion des rayons X, mais ne peut pas être obtenu directement à partir de la séquence protéique. Ainsi, prédire le facteur B uniquement sur la base de la séquence protéique pourrait fournir des références aux chercheurs concernés. Dans cette étude, nous tentons de prédire le facteur B sur la base de la séquence protéique. Les informations contenues dans AAindex et la structure secondaire prédite des protéines, l'accessibilité relative, le désordre et les changements d'énergie sont utilisées pour décrire les résidus d'acides aminés. Quatre méthodes d'apprentissage automatique sont utilisées pour la modélisation et la prédiction. La validation croisée en 5 étapes est utilisée pour évaluer les performances de la modélisation. En conséquence, ce travail a fourni de nouvelles méthodes de prédiction et d'analyse du facteur B sur la base de la séquence protéique, et nous espérons que ce travail pourra être utile pour les recherches connexes.