职场文秘网

首页 > 心得体会 > 学习材料 / 正文

GlyCosmos门户网站在聚糖科学研究中的功能概述*

2023-02-07 17:30:13

吉腾桤 张 继

(1)西北师范大学生命科学学院,兰州 730070;
2)西北师范大学新农村发展研究院,兰州 730070)

随着生物学研究的不断深入,糖逐渐地体现出其在生命过程中的重要性,越来越多的生物学家开始进行糖生物学研究。在各种生物学研究方法中,计算机技术因其便捷性、低成本、可预测性等优点,有助于快速而动态地分析并预测生物大分子的结构与功能,已广泛应用于生物学领域的各项研究[1]。随着人工智能和数据库技术的不断进步和完善,日本创价大学的Kiyoko 教授等[2]开发并于2019年4月1日创立了GlyCosmos门户网站(https://glycosmos.org/)[3],通过人工智能与数据库相结合,将各种聚糖的数据进行整合分析。该网站分为存储库、数据库和国际标准3个模块,不仅能够上传自己的糖数据进行注册分享、查询各种糖数据(包括糖组、糖原、糖蛋白和凝集素等),还能查询最新的糖表示法[4-7]。该数据库已经被学术界广泛认可和熟知,对于新近加入到糖生物学研究领域的相关研究人员,该数据库可以提供大量的帮助,使相关研究工作更加便捷。

GlyCosmos 提供对3个存储库的访问:GlyTouCan[8]、 GlyComb 和 GlycoPOST[9]。GlyTouCan是为糖生物学开发的第一个国际聚糖结构存储库。GlyCom 目前仍在开发中,但它是糖缀合物存储库,而GlycoPOST 是聚糖和糖蛋白质谱(MS)的存储库。存储库的建立是为数据库建立基础,存储库对于所有用户都是完全开放的,研究者可以将自己所研究的聚糖或者寡糖的相关数据保活结构数据和活性数据上传至存储库,实现数据的分享与互联,每一个研究者都是存储库的建立者,随着多糖的研究越来越深入,存储库也会日益完善和全面。

1.1 GlyTouCan

GlyTouCa为聚糖提供登录号(ⅠD),无论其是否用所有已知的糖苷键完全表征,或者是片段,或者只是一组单糖,都可以使用图形工具注册聚糖,以GlycoCT 或WURCS 格式指定聚糖结构的文本,或包含此类文本的文件[10]。但是,GlyTouCan 仅接受带有单糖及其修饰的结构;
在注册前必须去除苷元或非单糖残基,例如氨基酸。GlyTouCan是目前最为全面的聚糖存储库。

1.2 GlyComb

GlyComb 目前正被开发为糖缀合物存储库。因为目前尚不存在这样的存储库,但是需要为糖缀合物和糖脂分配登录号[11]。因此,GlyComb 将主要用于解决这个问题,用户可以通过该系统指定聚糖及其糖基化的蛋白质或脂质。该存储库旨在使糖蛋白和糖脂也能注册,从而存进数据库中实现数据的共享,为相关领域的研究人员提供便利。

1.3 GlycoPOST

GlycoPOS 用于糖组学实验的质谱数据检索。可以创建包含有关科研人员实验原数据的“预设”。然后可以将预设与包含实际原始数据的项目链接起来。该存储库是将糖组学的相关实验数据存储进数据库从而实现数据的分享,为建立起一个更加立体和全面的聚糖数据库打下基础,目前该存储库同样正在进行开发。

在GlyCosmos的数据库中,给出了各种糖相关的数据类型及意义(表1)。

Table1 Sugar data types and meanings included in GlyCosmos表1 GlyCosmos中包含的糖数据类型及意义

2.1 糖组

虽然完全表征糖组的高通量技术仍处于早期阶段,但世界各地的科学家已经为此做出了许多努力。GlyCosmos 中的GlycomeAtlas[12]模块最初是在RⅠNGS[4](http://www.rings.t.soka.ac.jp)中开发的,现在提供了人类、小鼠、斑马鱼糖组的可视化工具[13],该资源也可以在GlyCosmos 中获得。另外GlyCosmos还提供了多种可视化工具,让科研人员可以比较已经积累的各种数据。关于糖组的数据库是最多的,同时功能也是最为全面的,甚至包括可视化的数据库,因此是使用最多的数据库。

2.2 糖原及糖蛋白

GlyCosmos数据库通过语义Web技术将蛋白质数据和糖数据进行融合[14],这使得能够整合来自蛋白质数据库(PDB)[15]和Uniprot[16]数据库的数据,形成糖原以及糖蛋白的相关数据。因此该数据库主要用于糖蛋白和糖原相关数据的检索。

2.3 凝集素

GlyCosmos 中凝集素是PDB 中的蛋白质条目列表,在UniProt 中注释为凝集素。如果凝集素是糖基化的,它的糖基化位点信息也会显示出来[17]。例 如,多 囊 蛋 白1 (polycystin-1,UniProt ⅠD P98161)是一种高度糖基化的凝集素,只需按糖基化位点的数量对列表进行排序即可轻松找到。因此该数据库主要用于凝集素相关数据的检索。

2.4 通路和疾病

GlyCosmos 提供了对GlyCosmos Pathways[10]、Glyco-Disease Genes Database[18]和 PacDB(Pathogen Adherence to Carbohydrate Database)[19]的访问。GlyCosmos Pathways表示涉及糖蛋白的通路。这些通路数据是从Reactome 数据库[20]中积累,并且提供信号通路可视化工具进行可视化[10]。

PacDB 由ACGG-DB 提供[21]。它提供了有关疾病发病机制的信息,其中微生物聚糖结合蛋白与宿主上的聚糖之间的相互作用尤为重要。目前,已记录了446种微生物,并列出了有关它们结合或不结合聚糖的信息。对于与多糖相关信号通路的相关数据,可以从这个数据库中获得。

国际标准由本体和符号两个子部分组成。这一部分中包含了多种国际上最新的统一标准化的多糖表示方法,既美观又能使信息交流更加便捷,越来越多的期刊上所发表的相关多糖研究均开始使用这些新的方法来表示作者所研究的多糖。学习并掌握这些新的多糖表示方法,对于拟从事多糖研究的相关研究人员能够提供很大的帮助和便捷。

3.1 本体

本体是指用于以系统化的方式描述数据的词汇表。最著名的本体是基因本体论,它根据基因的分子功能、细胞位置和生物过程来表述基因。在糖生物学中,GlycoRDF 首先被定义为描述聚糖结构的本体[22]。尽管名称中包含术语“RDF”,但它实际上并不是资源描述框架(RDF),而是一种被开发用来描述RDF 中的聚糖或语义Web 术语的本体。GlycoRDF允许用GlyTouCan ⅠD指定的聚糖注释出版信息,用于表征聚糖的实验,是否是生物来源或化学合成等[23]。GlyTouCan 使用的本体基于GlycoRDF,并且由于许多其他聚糖数据库也在使用GlycoRDF,因此可以直接的方式跨这些数据集进行语义Web查询[24]。

在GlyCosmos 中,本体子部分提供了对GlycoRDF 以及PacOnto(为描述PacDB 中的数据而开发的本体)和GGDonto(为描述GDGDB中的数据而开发的本体)的信息访问[20]。目前均已开发用于标准化聚糖及糖缀合物的表示。

3.2 符号

GlyCosmos的符号子部分提供了对国际理论与应用化学联合会(international union of pure and applied chemistry,ⅠUPAC)推荐的每个聚糖表示方法的详细信息的访问。这包括ⅠUPAC 法[25]、WURCS (Web3 unique representation of carbohydrate structures) 法[26]、 GlycoCT[27]和SNFG (symbol nomenclature for glycans) 法[28]。具体的表示格式都可以在GlyCosmos中查阅。

3.2.1 ⅠUPAC法

ⅠUPAC 法是国际理论与应用化学联合会提出的一种表示复合碳水化合物的表示法。使用符号代表寡糖结构,描述了如何通过两个基本原则来表示寡糖结构:a.使用3个字母的符号表示单糖残基;
b.还原基团,也即具有游离半缩醛基团的残基或其修饰(例如糖醇、醛糖酸、糖苷),应在右侧,当与非碳水化合物部分(例如蛋白质、肽或脂质)有糖基连接时,所涉及的糖基残基应出现在正确的位置[29]。例如:棉子糖α-D-Galp-(1→6)-α-L-Glcp-(1→2)-β-D-Frufα-D-Galp-(1→6)-α-L-Glcp-(1→2)-β-D-Fruf,可 以 用 精 简 形 式 表 示 为Gal(α1-6)Glc(α1-2β)Fruf,还可以进一步缩写为Galα-6GlcαβFruf或Galα6GlcαβFruf。ⅠUPAC 是最基础的一种表示法也是相对简单的一种表示法,掌握其规则后,就能很容易做出来,之后根据ⅠUPAC表示法,才能得到如下的其他表示方法。

3.2.2 WURCS法

据得到的ⅠUPAC 表示法,通过GlycanFormatConverte 网络页面的转换工具,将ⅠUPAC表示输入进去,很容易得到WURCS的表示形式。该表示法是一种计算机软件和网页可以识别的多糖代码串,是为了后续研究中研究对象可以被输入进计算机软件和网页中被读取识别所形成的一种多糖表示方法。复杂碳水化合物或聚糖的计算分析产生了许多线性和非线性符号来表示这些复杂结构。

因为GlyCosmos 是使用语义Web 技术开发的,所以对聚糖进行表示的首要要求之一是它是一个线性字符串。其次,它需要能够在不使用库的情况下表示不明确的结构[26]。例如,无论替换是否已知,都应该能够表示单糖上的新替换。因此,修改需要通过它们的化学(原子)结构而不是名称来指定。由于之前没有现有的这些聚糖表示法满足这些要求,因此开发了WURCS。WURCS 制定了一系列规则以确保所有聚糖表示都是唯一的,从而允许使用唯一标识符表示每个聚糖,形成一一对应的关系[30]。

3.2.3 GlycoCT

同样的, 根据ⅠUPAC 表示法, 通过GlycanFormatConverter网络页面的转换工具,得到其GlycoCT 的表示形式。和WURCS 表示法一样,该表示法同样是一种为了让计算机软件和网页能够识别的代码串,同样可以被输入进计算机软件和网页中被读取和识别。但是,可以很明显地看出,pap-1 的GlycoCT 表示法明显比WURCS 表示法要复杂且冗长的多,所以更多的是使用WURCS表示法,个别无法识别WURCS 表示法的软件和网页,可以通过GlycoCT表示法进行输入识别。

GlycoCT 最初由德国癌症研究中心的Claus 博士[31]领导。这种表示格式目前最常被生物信息学家使用,因为它是GlycomeDB 中使用的格式,GlycomeDB 是最早的整合聚糖结构数据库之一,现在已被集成到GlyCosmos中。

3.2.4 SNFG

在绘制多糖和交流沟通时,由于没有统一的标准,大部分研究还是再用chemoffice相关软件来绘制聚糖,过程很繁琐,而且别人阅读起来也会很困难,由此产生了一套新的统一的SNFG表示法,按照该表示法的规则,通过DrawGlycan-SNFG 软件可以绘制出SNFG表示法。该方法应用简单的不同颜色的符号和各种单糖相对应,一种符号专门表示一种单糖,并在横线上注明糖苷键类型,主链在上,支链在下,很容易就能绘制出多糖,并且别人阅读起来时也更加的方便,一个寡糖分子的单糖组成和糖苷键一目了然。绘制聚糖结构的标准化对于有效沟通至关重要。这里展示的工具和方法已被科学界广泛接受。建议提交给主要期刊和其他出版物的手稿都使用这些符号来表示单糖。关于命名的问题比科学问题更具争议性,因为从来没有一个正确的答案。

SNFG的符号集是根据由国际公认的糖生物学家、化学家和信息学家组成的工作组讨论而设计的。当前推荐的符号列表可在https://www.ncbi.nlm.nih.gov/glycans/snfg.html获得[32]。聚糖的符号表示法已被科学界广泛接受,强烈建议相关研究人员在提交给主要期刊和其他出版物的所有手稿中使用这些符号来表示单糖,因为SNFG法看起来更加美观也更加便利。在聚糖的符号表示法中,每个符号代表一种特定的单糖或自然界中发现的一类单糖[33]。例如:通过ⅠUPAC 表示法可以表示一个寡糖Rha(a1-6)[Man(a1-6)Glc(b1-3)]Gal(b1-6)Glc(b1-6)[Glc(b1-3)]Gal,其SNFG表示法如图1所示。

Fig.1 SNFG representation format of one oligosaccharide图1 某寡糖的SNFG表示格式

GlyCosmos门户网站是一个全新全面的聚糖研究门户网站,完全免费面向大众,实现聚糖研究相关信息的共享与查询,为从事相关领域研究的科研人员提供便捷,多样的功能在聚糖研究方面具有巨大的应用潜力。目前,该网站已经成为糖生物学研究领域的主要工具和手段,已被大多数相关学者接受和认可,因此,对于新加入到糖生物学领域进行研究的新人和相关研究人员来说,该网站可以提供大量帮助,使研究更加便捷。但由于2019年4月1日才成立,GlyCosmos门户网站还有很多问题需要解决和完善。首先,作为一个全面的综合的聚糖门户网站,由于刚成立不久,用户数量需要扩大,以提高聚糖的数据量;
其次,网站的页面及各模块通道需要美化简化,以方便进行相关数据的查询、上传及下载;
最后,还要不断优化网站,以成为主流的专业的聚糖研究门户网站。相信随着计算机技术的进步,GlyCosmos门户网站有望在聚糖研究中发挥出越来重要的作用。

猜你喜欢 凝集素单糖聚糖 小麦型饲粮中添加酸性木聚糖酶对肉鸡消化道食糜黏度的影响动物营养学报(2022年9期)2022-10-12大型真菌凝集素的结构、糖特异性以及其在免疫调节中的研究进展*中国食用菌(2021年12期)2022-01-06鱼类凝集素概述农产品加工(2021年5期)2021-12-06凝集素的结构特征及其生物技术应用进展中国饲料(2021年22期)2021-12-02木聚糖酶在烘焙中的应用粮食加工(2021年5期)2021-11-01非淀粉多糖对肉鸡生长和发育的影响中国饲料(2021年2期)2021-02-23β-甘露聚糖酶Man5A和木聚糖酶Tlxyn11B的融合表达生物工程学报(2020年9期)2020-04-15以科研探索思想渗透生物化学教学的课程设计教育教学论坛(2018年6期)2018-03-15恒温条件下采收时机对铁皮石斛多糖的影响中国中药杂志(2017年20期)2017-11-11液相色谱测定单糖与二糖和低聚半乳糖的方法研究科技资讯(2017年20期)2017-08-22

Tags: 聚糖   站在   门户网  

搜索
网站分类
标签列表