ISSN: 2329-6674
Guang Wu et Shaomin Yan
Saccharomyces cerevisiae est la levure la plus utilisée dans la recherche et l'industrie, mais les processus en aval pour sa production de protéines sont coûteux. Cette étude a tenté de trouver un moyen simple de prédire le taux de réussite de la purification des protéines avec les caractéristiques des acides aminés. La régression logistique et le modèle de réseau neuronal ont été utilisés pour tester chacune des 535 caractéristiques des acides aminés une par une par rapport à l'état de purification de 1294 protéines exprimées par S. cerevisiae, dont 870 ont été purifiées. Les résultats montrent que la performance prédictive du réseau neuronal est plus puissante que celle de la régression logistique. Certaines caractéristiques des acides aminés sont utiles pour prédire la tendance à la purification des protéines, et les différentes caractéristiques des acides aminés fonctionnent mieux comme le démontre une sensibilité très élevée accompagnée d'une faible spécificité. De plus, les protéines de S. cerevisiae avec une proportion prédictible élevée de paires d'acides aminés ont une précision de prédiction de purification plus élevée que celles avec une faible proportion prédictible. Ainsi, le taux de réussite de la purification des protéines de S. cerevisiae peut être prédit à l'aide d'un réseau neuronal basé sur les informations de séquence protéique. Ce processus de prédiction simple peut fournir un concept sur la probabilité qu'une protéine soit purifiée, ce qui devrait être utile pour surmonter les expériences à l'aveugle et améliorer la production de protéines conçues.