ISSN: 2376-130X
Jon Ander Gómez Adrián
La plupart des techniques d'intelligence artificielle, en particulier celles qui appartiennent à l'apprentissage automatique, ont besoin d'autant de données que possible pour obtenir des modèles plus robustes et plus précis formés au moyen d'algorithmes qui utilisent des échantillons de données pour ajuster les paramètres du modèle. À titre d'exemple, un modèle basé sur des réseaux neuronaux profonds comporte des millions de paramètres (appelés poids) dont les valeurs sont progressivement mises à jour par l'algorithme Error-Backpropagation qui visite de manière itérative tous les échantillons de l'ensemble de données d'entraînement. M. Cukier a expliqué que les chercheurs de l'Université de Stanford ont utilisé des milliers d'échantillons de cellules mammaires cancéreuses et les taux de survie des patients pour former un modèle d'apprentissage automatique, et ont défini la fonction d'objectif de l'algorithme d'apprentissage pour identifier les modèles dans les attributs des données d'entrée qui correspondent le mieux à l'objectif de prédire si une biopsie donnée sera gravement cancéreuse. Le modèle d'apprentissage automatique obtenu a identifié onze attributs qui prédisent le mieux qu'une biopsie est hautement cancéreuse. Ce qui a surpris les chercheurs, c'est que seuls huit de ces onze attributs étaient auparavant connus des médecins et étudiés dans la littérature médicale. Les chercheurs de Stanford ont inclus dans l’expérience tous les attributs des données d’entrée, sans indiquer à l’algorithme d’apprentissage lesquels utiliser. Il en est résulté que trois des attributs (ou indicateurs) trouvés par l’algorithme d’apprentissage automatique n’ont pas été considérés comme pertinents par la communauté médicale ; les pathologistes n’ont jamais concentré leur attention sur ces indicateurs. Comme l’a fait remarquer M. Cuckier, l’apprentissage automatique fonctionne parce que l’algorithme d’apprentissage est alimenté par une grande quantité de données, bien plus d’informations que ce qu’un être humain pourrait digérer en une vie et gérer à tout moment.