ISSN: 2471-9315
Prachi Singh
La réalisation du projet Génome humain a conduit à la prolifération des données de séquençage génomique. Ceci, associé au séquençage de nouvelle génération, a permis de réduire le coût du séquençage, ce qui a encore accru la demande d'analyse de ces vastes données génomiques. Cet ensemble de données et son traitement ont aidé la recherche médicale.
Ainsi, nous avons besoin d'une expertise pour traiter les big data biologiques. Le concept de cloud computing et les technologies de big data telles que le projet Apache Hadoop sont ici nécessaires pour stocker, gérer et analyser ces données. En effet, ces technologies fournissent un traitement de données distribué et parallélisé et sont efficaces pour analyser des ensembles de données même à l'échelle du pétaoctet (Po). Cependant, il existe également certains inconvénients, notamment le besoin de temps de transfert de données plus long et une bande passante réseau plus faible, principalement.