Glycosciences.DB : une collection de donnandeacute;es annotandeacute;es reliant les donnandeacute;es glycomiques et protandeacute;omiques

Michael Böhm

Abstrait

Glycosciences.DB : une collection de données annotées reliant les données glycomiques et protéomiques

Michael Böhm

Glycosciences.DB, la base de données sur les structures des glycanes du portail Glycosciences.de, collecte différents types de données sur les structures des glycanes, y compris les fragments glucidiques issus des structures de la Protein Data Bank du monde entier. Elle constitue ainsi un pont entre les ressources de glycomique et de protéomique. Une mise à jour majeure de cette base de données combine une interface Web repensée avec une série de nouvelles fonctions. Celles-ci comprennent des pages d'entrée séparées non seulement pour les structures des glycanes mais aussi pour les références et les entrées de la littérature, des options de recherche de sous-structures améliorées, une recherche par mot-clé nouvellement disponible couvrant tous les types d'entrées dans une seule requête et de nouveaux types d'informations qui sont ajoutés aux structures des glycanes. Ces nouvelles fonctionnalités sont décrites en détail dans cet article, et les options permettant aux utilisateurs de fournir des informations à la base de données sont également abordées. Glycosciences.DB Les glucides, souvent appelés glycanes, sont l'une des quatre principales classes de biomolécules, à côté des acides nucléiques, des protéines et des lipides. Parmi celles-ci, les glucides sont les molécules les plus abondantes et aussi les plus complexes. Outre leurs fonctions bien connues de stockage d’énergie ou de composants structurels, ils font partie des glycoprotéines ou des glycolipides et recouvrent les surfaces cellulaires du glycocalyx. Ils servent ici de sites de reconnaissance pour les interactions cellule-cellule et cellule-matrice, mais aussi pour les agents pathogènes tels que les virus, qui interagissent fréquemment avec les glycanes à la surface cellulaire pour pénétrer dans leurs cellules hôtes. Les glycanes sont également impliqués dans les réponses immunitaires, l’inflammation et les maladies telles que le cancer. Les glucides sont souvent reconnus spécifiquement. Par exemple, les virus de la grippe humaine et aviaire reconnaissent leurs hôtes par des motifs glycaniques spécifiques. Par conséquent, les chercheurs des projets liés à la glycomique doivent être en mesure de trouver des informations sur les glycanes spécifiques qui les intéressent. Glycosciences.DB, anciennement connu sous le nom de SweetDB , a été l’un des premiers efforts visant à collecter des informations sur les structures des glucides et à les rendre disponibles en ligne. Initialement alimentée par des données provenant de la base de données sur les structures complexes des glucides (CCSD, souvent appelée CarbBank), qui n'existe plus, des informations supplémentaires ont été ajoutées au fil des ans, telles que des modèles de structure 3D générés par Sweet-II, des spectres de résonance magnétique nucléaire (RMN) importés de SugaBase ou saisis manuellement à partir de la littérature, ou des liens vers des entrées de la banque de données mondiale sur les protéines ( ) qui présentent des glucides. Actuellement, la est la principale source de nouvelles données dans Glycosciences.DB. Au moment de la rédaction de cet article, Glycosciences.DB contient environ 25 000 entrées de structure de glycane avec 12 500 modèles de structure 3D, 20 000 références bibliographiques, 3 400 spectres RMN 1H ou 13C et plus de 10 000 références à des entrées contenant des glucides. En 2018, une mise à jour majeure du portail Glycosciences.de a été publiée, qui non seulement apporte un design plus moderne au portail, mais ajoute également une série de nouvelles fonctionnalités à Glycosciences.DB, notamment des améliorations dans les fonctions de recherche et dans l'affichage des informations. Avant la mise à jour de 2018,Jusqu'à présent, seuls les glycanes étaient considérés comme des entrées dans Glycosciences.DB. Tous les autres éléments tels que les références bibliographiques ou les structures n'étaient affichés que comme parties des entrées glycanes ou dans les listes de résultats de recherche. Désormais, les structures et les publications reçoivent également des pages d'entrée individuelles, qui affichent plus de données que dans la version précédente. Les trois types d'entrées, à savoir les glycanes, les publications et les structures, sont liés entre eux. Pour chaque type d'entrée, un symbole individuel est utilisé, qui est affiché dans l'en-tête de l'entrée et également utilisé dans les liens croisés et les listes de résultats de recherche, afin que les utilisateurs puissent voir directement quel type d'entrée sera ouvert dans un lien. Captures d'écran de l'entrée de structure glycane de Glycosciences.DB (avant, tronquée au niveau de la ligne pointillée), de l'entrée de littérature (milieu) et de l'entrée (arrière). Les trois entrées sont liées les unes aux autres : L'entrée contient à la fois l'entrée de structure de base N-glycane affichée et la référence bibliographique. Aucune structure glycane n'est encore enregistrée avec l'entrée de littérature ; le lien vers l'entrée de structure de base N-glycane est attribué via l'entrée. De nouvelles entrées sont ajoutées chaque semaine en téléchargeant les structures nouvellement publiées à partir de la base de données et en les recherchant pour les fractions glucidiques. Ce processus est en grande partie automatique. L'intervention humaine n'est requise qu'en cas de problèmes potentiels, tels que des incohérences entre le nom du résidu et le résidu réellement présent dans la structure 3D, ou des noms de résidus nouvellement introduits pour lesquels aucune définition n'est stockée dans pdb2linucs et pdb-care, les outils utilisés pour détecter et valider les glycanes dans les structures. La citation principale d'une entrée est également importée à partir de la base de données et stockée dans Glycosciences.DB. De cette façon, les entrées peuvent être automatiquement liées aux entrées de glycane et de littérature. Les liens croisés entre les deux derniers types d'entrées ne peuvent pas être ajoutés automatiquement de manière fiable, car il n'existe aucun outil disponible permettant d'extraire de manière fiable des informations sur les glucides pertinents d'une publication. Néanmoins, la référence principale d'une entrée traite souvent également des glucides de cette entrée, en particulier dans le cas de complexes protéines-glucides, où les fractions glucidiques ont été ajoutées volontairement et constituent donc généralement (mais pas certainement) également un sujet important de la publication. Ce n'est pas nécessairement le cas des glycoprotéines, où les glycanes peuvent également être un sujet majeur de la publication, mais souvent (en particulier dans le cas de glycanes courts et tronqués) sont simplement indiqués comme « également détectés » ou même pas mentionnés du tout. Par conséquent, les liens croisés entre les glycanes et les entrées de la littérature qui sont attribués via des entrées ne sont pas répertoriés avec les liens croisés attribués manuellement, mais dans une section distincte, afin que les utilisateurs puissent les identifier facilement. Les entrées de structure des glycanes constituent toujours la partie principale du contenu de Glycosciences.DB. Les entrées collectent des informations sur une structure glucidique, telles que des modèles de structure 3D, des spectres RMN, des références bibliographiques,Références aux entrées et informations sur la composition des résidus, les motifs de sous-structure, les noms triviaux et les données de taxonomie. La mise à jour 2018 s'accompagne de quelques éléments supplémentaires. Les informations sur la structure des glycanes (séquence des monosaccharides et positions de liaison) n'étaient jusqu'à présent fournies que sous forme d'annotation 2D au format CarbBank. Nous proposons désormais également la structure en notation LINUCS (LInear Notation for Unique description of Carbohydrate Sequences), la notation utilisée en interne dans la base de données pour stocker et identifier les structures des glycanes, et, lorsque cela est possible, au format GlycoCT_condensed et GlycoCT_xml. Pour plus d'informations sur les formats de structure des glycanes, veuillez vous référer à . En plus de ces formats de texte, des graphiques SNFG (Symbole Nomenclature des glycanes) ont également été ajoutés à de nombreuses entrées de glycanes. Cependant, au moment de la rédaction du présent document, toutes les nouvelles fonctionnalités définies de la version SNFG actuelle ne sont pas encore intégrées. Des liens croisés vers des entrées correspondantes d'autres bases de données du portail Glycosciences.de (GlycoMapsDB et GlycoCD) sont désormais également fournis, le cas échéant. Une fonctionnalité utilisée par de nombreuses bases de données génomiques, protéomiques ou bibliographiques, mais pas encore, à notre connaissance, par les bases de données glycomiques, est la possibilité d'ajouter des mots-clés à une entrée de base de données, qui peuvent être utilisés pour identifier cette entrée dans une recherche de base de données. Cette option est désormais implémentée dans Glycosciences.DB. Par analogie avec les entrées de littérature et les entrées, des titres peuvent désormais être ajoutés aux entrées de structure glycanique dans Glycosciences.DB. Il sera difficilement possible d'ajouter des titres significatifs à toutes les entrées. Néanmoins, il existe divers glycanes pour lesquels des noms triviaux sont largement utilisés (par exemple pour les antigènes de groupe sanguin de type Lewis, les oligosaccharides du lait maternel, les glycosphingolipides de la série ganglionnaire, etc.), et pour de nombreux autres glycanes, une brève description telle que « structure de base du N-glycane fucosylé » peut être utile pour les utilisateurs qui ne sont pas encore familiarisés avec les structures des glycanes. Ces titres peuvent également être utilisés dans les requêtes de base de données et sont affichés avec la structure du glycane dans les résultats de requête de structure et dans les listes de structures, par exemple dans les entrées de littérature, pour aider les utilisateurs à identifier les glycanes affichés. Les modèles de structure 3D fournis avec de nombreuses entrées peuvent donner aux chercheurs une idée de ce à quoi ressemblent les glycanes. Cependant, il peut être difficile de lire la structure 3D d'un glycane et de trouver un résidu spécifique dans la structure, car les éléments constitutifs monosaccharides qui forment les glycanes sont très similaires les uns aux autres. Nous avons donc ajouté une option permettant de mettre en évidence les résidus en utilisant les couleurs des symboles SNFG, ce qui facilite l'orientation dans une structure 3D de glycane. Les halos ou les couleurs de liaison peuvent être activés à l'aide des cases à cocher dans les options d'affichage à côté de la structure 3D. Jusqu'à présent, les couleurs sont définies par des codes PDB à 3 lettres pour les résidus fréquemment présents. La liste des codes à 3 lettres pris en charge sera encore étendue pour couvrir davantage de résidus à l'avenir.Mise en évidence des résidus dans un N-glycane végétal avec fucosylation du noyau et xylose (LinucsID 13934). Sans mise en évidence, les résidus sont difficiles à identifier (en haut). Cela devient plus facile lorsque des halos (en bas à gauche) ou des couleurs de liaison (en bas à droite) sont utilisés avec des couleurs correspondant à celles des symboles SNFG, même lorsque la structure est orientée d'une manière différente de celle des symboles SNFG.

Clause de non-responsabilité: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été révisé ou vérifié.

Journal of Glycomics & LipidomicsLibre accès

Abstrait

Glycosciences.DB : une collection de données annotées reliant les données glycomiques et protéomiques

Journal of Glycomics & Lipidomics
Libre accès