Gynécologie & Obstétrique

Gynécologie & Obstétrique
Libre accès

ISSN: 2161-0932

Abstrait

Une application de l'apprentissage automatique en FIV : comparaison de la précision des algorithmes de classification pour la prédiction des jumeaux

Rinehart John

Contexte : Les dilemmes de prise de décision clinique sont particulièrement notables dans la pratique de la FIV, étant donné que de grands ensembles de données sont souvent générés, ce qui permet aux cliniciens de faire des prédictions qui éclairent les choix de traitement. Cette étude a appliqué l'apprentissage automatique en utilisant les données de FIV pour déterminer le risque de jumeaux lorsque deux embryons ou plus sont disponibles pour le transfert. Alors que la plupart des classificateurs sont capables de fournir des estimations de précision, cette étude est allée plus loin en comparant les classificateurs à la fois par précision et par aire sous la courbe (AUC).
Méthodes : Les données de l'étude ont été dérivées d'un grand système de dossiers médicaux électroniques utilisé par plus de 140 cliniques de FIV et contenant 135 000 cycles de FIV. L'ensemble de données a été réduit de 88 variables à 40 et n'incluait que les cycles de FIV où deux embryons blastocystes ou plus ont été créés. Les classificateurs suivants ont été comparés en termes de précision et d'AUC : un modèle linéaire généralisé, une analyse discriminante linéaire, une analyse discriminante quadratique, les K plus proches voisins, une machine à vecteurs de support, des forêts aléatoires et un boosting. Un algorithme d'apprentissage d'ensemble par empilement a également été appliqué afin d'utiliser les prédictions des classificateurs pour créer un nouveau modèle.
Résultats : Bien que le classificateur d'ensemble soit le plus précis, aucun des classificateurs ne prédomine comme étant significativement supérieur aux autres classificateurs. Les résultats ont indiqué que les méthodes de boosting pour les classificateurs étaient peu performantes ; les classificateurs d'analyse discriminante logistique et linéaire étaient plus performants que le classificateur d'analyse discriminante quadratique, et la machine à vecteurs de support était presque aussi performante que le classificateur d'arbre. Les résultats de l'AUC étaient cohérents avec les comparaisons de précision. Une validation externe a également été réalisée à l'aide d'un ensemble de données différent contenant 588 observations. Tous les modèles ont obtenu de meilleurs résultats en utilisant l'ensemble de données de validation externe, le classificateur de forêt aléatoire étant nettement plus performant que tout autre classificateur.
Conclusions : Ces résultats confirment l'impression que le big data peut être utile dans le processus de prise de décision clinique ; mais qu'aucun algorithme statistique unique n'offre une précision maximale pour toutes les bases de données. Par conséquent, différents ensembles de données nécessiteront une étude afin de déterminer quels algorithmes sont les plus précis pour un ensemble de données particulier. Ces résultats soulignent l’hypothèse selon laquelle les cliniciens ayant accès à de grandes quantités de données peuvent utiliser des modèles d’analyse prédictive avancés pour créer des informations cliniques robustes d’une importance vitale pour les soins aux patients.

Clause de non-responsabilité: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été révisé ou vérifié.
Top