Techniques avancées en biologie et médecine

Techniques avancées en biologie et médecine
Libre accès

ISSN: 2379-1764

Abstrait

Analyse des ensembles de données pour le calcul de l'efficacité prédictive des modèles QSAR basés sur les falaises d'activité

Fatima Adilova et Alisher Ikramov

Le concept de falaise d'activité est d'une grande pertinence pour la chimie médicinale. Nous explorons ici un concept de « modélisabilité d'ensemble de données », c'est-à-dire une estimation a priori de la faisabilité d'obtenir des modèles QSAR prédictifs externes pour un ensemble de données de composés bioactifs. Ce concept est né de l'analyse de l'effet des « falaises d'activité » sur la performance globale des modèles QSAR. Certains indices de « modélisabilité » (SALI, ISAC et MODI) sont déjà connus. Nous avons étendu la version de MODI à des ensembles de données de composés avec des valeurs d'activité réelles. L'efficacité prédictive des modèles QSAR est évaluée comme le taux de classification correct par l'algorithme SVM, qui est comparé aux résultats des deux autres algorithmes : l'algorithme MODI et l'algorithme de Voronin modifié par les auteurs. Analyse comparative des résultats réalisés à l'aide du coefficient de corrélation de Pearson au carré. Notre étude a montré un manque extrême d'évaluation de l'efficacité prédictive de l'ensemble de données uniquement basée sur les « falaises d'activité ». Dans le développement de méthodes plus précises permettant d'évaluer la possibilité de construire des modèles efficaces sur les échantillons de données, il est nécessaire de prendre en compte d'autres propriétés de l'échantillon, et pas seulement la présence (et le nombre) de « falaises d'activité ».

Clause de non-responsabilité: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été révisé ou vérifié.
Top