ISSN: 2167-0870
Lichao Cao, Ying Ba, Jin Yang*, Hezi Zhang*
Contexte : Ce travail étudie l'utilisation de biomarqueurs pilotés par méthylation pour le diagnostic et le pronostic du cancer colorectal (CCR) en exploitant les données de méthylation de l'ADN et d'expression génique du Cancer Genome Atlas (TCGA), du projet Genotype-Tissue Expression (GTEx) et du Gene Expression Omnibus (GEO).
Méthodes : Les gènes différentiellement exprimés (DEG) et les gènes différentiellement méthylés (DMG) ont été examinés à l'aide des données d'expression d'ARNm et de méthylation de l'ADN de TCGA, respectivement. Les gènes induits par la méthylation (MDG) du CCR ont été identifiés plus en détail à l'aide du package R MethylMix. Par la suite, les MDG ont été analysés avec des algorithmes Random Forest (RF), Support Vector Machine (SVM) et Logistic Regression (LR) pour établir des modèles de prédiction de diagnostic en tant qu'indicateurs indépendants à l'aide des données d'expression d'ARNm de TCGA et GTEx. L'algorithme RF s'est avéré le plus approprié et a été utilisé pour construire le modèle de diagnostic avec les MDG combinés, qui a ensuite été validé par GSE39582 de GEO. Des biomarqueurs pronostiques ont été utilisés pour établir le modèle de score de risque, qui a été généré par des analyses de régression de Cox univariées et multivariées. De plus, nous avons construit et validé un nomogramme qui intégrait le score de risque et les informations cliniques, notamment l'âge, le sexe et le stade de la tumeur.
Résultats : 9 des 10 MDG se sont révélés efficaces en tant que prédicteurs diagnostiques indépendants, et STK33 et EPHX4 se sont également révélés être associés à la survie globale (SG). Les résultats du nomogramme suggèrent qu'il s'agit d'un meilleur modèle prédictif du pronostic que le modèle de score de risque.
Conclusion : Nos résultats suggèrent que les OMD identifiés pourraient être des biomarqueurs pour le diagnostic et le pronostic du CCR.