ISSN: 2379-1764
Fatima Adilova et Alisher Ikramov
Le concept de falaise d'activité est d'une grande pertinence pour la chimie médicinale. Nous explorons ici un concept de « modélisabilité d'ensemble de données », c'est-à-dire une estimation a priori de la faisabilité d'obtenir des modèles QSAR prédictifs externes pour un ensemble de données de composés bioactifs. Ce concept est né de l'analyse de l'effet des « falaises d'activité » sur la performance globale des modèles QSAR. Certains indices de « modélisabilité » (SALI, ISAC et MODI) sont déjà connus. Nous avons étendu la version de MODI à des ensembles de données de composés avec des valeurs d'activité réelles. L'efficacité prédictive des modèles QSAR est évaluée comme le taux de classification correct par l'algorithme SVM, qui est comparé aux résultats des deux autres algorithmes : l'algorithme MODI et l'algorithme de Voronin modifié par les auteurs. Analyse comparative des résultats réalisés à l'aide du coefficient de corrélation de Pearson au carré. Notre étude a montré un manque extrême d'évaluation de l'efficacité prédictive de l'ensemble de données uniquement basée sur les « falaises d'activité ». Dans le développement de méthodes plus précises permettant d'évaluer la possibilité de construire des modèles efficaces sur les échantillons de données, il est nécessaire de prendre en compte d'autres propriétés de l'échantillon, et pas seulement la présence (et le nombre) de « falaises d'activité ».