Feb 03, 2020

複合糖質のデータベース
(GlyCosmos Glycoproteins and glycolipid、GlycoProtDB、GlycoNAVI -TCarp、GlycoPOST)
(Glycoforum. 2020 Vol.23 (1), A2)
DOI: https://doi.org/10.32285/glycoforum.23A2J

山田 一作 / 安形 清彦 / 渡辺 由 / 小野 多美子

山田 一作

氏名:山田 一作
1997年に東京都立大大学院工学研究科にて博士号取得。名古屋大学(日本学術振興会特別研究員(COE))などを経て、2002年から野口研究所研究員、2006年から同所にて糖鎖科学研究を開始し、糖鎖構造表記法、オントロジー、データベースなど糖鎖インフォマティクス研究に従事している。

安形 清彦

氏名:安形 清彦
筑波大学大学院 生物科学研究科で学位取得後、La Jolla Cancer Research Foundation(現Sanford Burnham Prebys Medical Discovery Institute)にて、福田穰教授のもとで糖鎖生物学の研究について学ぶ。現所属(産総研)では、糖鎖遺伝子の発現解析、糖鎖の新しい機能の解析や糖鎖の応用について研究するとともに糖鎖DB(ACGG-DB)の開発に参画しています。

渡辺 由

氏名:渡辺 由
2013年より新潟大学大学院医歯学総合研究科にて技術補佐員、研究員を経て、2018年より特任助手。主に、Web技術をベースにしたデータベースや解析ツールの開発に従事している。

小野多美子

氏名:小野 多美子
2017年9月より創価大学理工学部木下研究室の研究補佐員としてJSTの統合化推進プログラムに参加。GlyCosmosポータルの開発、データ収集に従事しています。

1. 序文

本シリーズの第6回では、複合糖質として糖脂質や糖タンパク質のデータベース、リポジトリについて説明いたします。多くのタンパク質は翻訳後修飾により糖タンパク質となり様々な機能を発現しています。そしてタンパク質を修飾する糖鎖は様々な構造が含まれています。また、疾患等により修飾される糖鎖構造が異なることも知られています。ここでは、複合糖質のデータベースおよび糖鎖・糖タンパク質の質量分析のデータリポジトリについて紹介します。

2. 複合糖質のデータベース

2-1. GlyCosmos Glycoproteins and Glycolipids

GlyCosmos GlycoproteinsはUniProt1から糖鎖修飾の注釈がつけられているタンパク質を抽出してまとめた糖タンパク質のリストです(図 1)。リストには、Protein Name、UniProt ID、Gene Symbol、Organism、Glycosylation siteの数が表示されています。また、UniProt IDで紐づけられたMCAW-DB2のMCAW IDsも表示されています。MCAW-DBについては、本シリーズレクチンのデータベースの現状で紹介されています。リスト右上のSearchからは、Protein Name、Gene Symbolのテキスト検索が可能です。

リストの Protein Nameをクリックすると、Glycoproteinのエントリーページ(図 2)に移動します。エントリーページには、Glycosylation Sites、Sequence、Feature、PDB Images、Pathway、MCAW-DB (Glycan Recognition Profile) Image、Human Protein Atlasといったコンテンツがあります(表 1)。

GlyCosmos GlycolipidsはLIPID MAPS Structure Database (LMSD)8から「"glyco", "glycan", "sugar", "saccharolipids"」のキーワードでピックアップしてまとめた糖脂質のリストです。GlyCosmos Glycolipidのトップページ(図 3)のLipid Classificationから検索したい糖脂質のカテゴリを選択します。カテゴリは階層になっており、最下層のカテゴリを選択すると糖脂質のリストが表示されます。リストには、Category、LM ID(LIPIDMAPS ID)、 Common Name, Systematic Name、Exact Mass、Formulaが表示されます。 LM IDをクリックするとLIPIDMAPSのページに飛びます。

図1
図 1 GlyCosmos Glycoproteinsトップページ
図2
図 2 GlyCosmos Glycoproteins エントリーページ(UniProtID : O00602)
表 1 Glycoproteinsのエントリーページのコンテンツ
コンテンツ内容
Glycosylation Sites糖鎖修飾部位と、文献情報がある場合はPubMed IDを表示しています。
Sequence配列と共にN-glycosylation SiteとPotential Sequonの情報を表示しています。
Featureタンパク質のドメインやアミノ酸修飾など、配列の注釈の情報を視覚的に確認することができます。この表示にはProtVista3というツールが用いられています(図 4)。
PDB ImagesProtein Data Bank(PDB)4の画像から立体構造について確認することができます。3Dで視覚化されているLiteMol Viewer5へのリンクがあり、より詳細に分子構造を確認することができます(図 5)。LiteMolでは糖鎖構造がSNFG形式で表示されています。
Pathway糖タンパク質が反応に関与しているPathwayの一覧が表示されます。ここで表示させているPathwayはReactome6から抽出されています。クリックすると、GlyCosmos Pathwaysのページに移動してPathwayの詳細情報を確認することができます。
MCAW-DB (Glycan Recognition Profile) ImageMCAW-DBのアラインメント結果が表示されています。
Human Protein Atlas生物種がHomo Sapiensの場合、臓器別の細胞局在を確認することできます。HumanProteinAtlas7で発現量がHighとなっている臓器の一覧を表示させており、HumanProteinAtlasへのリンクがついています。
図3
図 3 GlyCosmos Glycolipidのトップページ
図4
図 4 ProtVistaでの配列の可視化(UniProtID : Q2N0S6)
図5
図 5 PDB Imagesおよび、LiteMolでの分子構造の可視化 (UniProtID : Q2N0S6)
2-2. GlycoProtDB : Glycoprotein Database

最近ではプロテオーム解析が進みデータが蓄積されたため、修飾を含めたプロテインデータベースが多数報告されています。しかしながら、糖鎖結合部位や糖鎖の構造を含めたデータベースは限られています。Unipep の様に同定されたN型糖鎖を含むペプチドのデータベースや、糖鎖修飾部位の情報を含むUniProtKBや糖鎖の組成を含むGlyConnectなどから情報を得ることが可能です。糖鎖構造に着目して質量分析法によって同定したN型糖鎖付加部位をデータベース化したのがGlycoprotein Database(GlycoProtDB, Kaji et al. 2012)で、日本糖鎖科学総合データベース(JCGGDB)の一つとして公開されました。現在では、表示方法などインターフェースや記載内容などを変更した最新版をACGG内で公開していますので、その特徴について紹介いたします。

GlycoProtDBでは、線虫、ヒト、マウスの組織や細胞および血清などから取得したデータをリストしていますが、左側にあるカラムから取得したい組織や細胞を選択し、アルファベット順に表示することができます(図 6)。また、興味のある糖タンパク質を入力することでデータを検索することも可能です。

図6
図 6 GlycoProtDBの検索ページ
①線虫、ヒト、マウスの組織や細胞を選択して検索できます。②糖タンパク質名を入力して検索できます。③ Gene Symbol ④UniProtのアクセッション番号

検索結果から糖タンパク質を選択すると、詳細ページにて糖タンパク質上のN型糖鎖付加部位やアミノ酸配列を見ることできます(図 78)。GlycoProtDBの主要な特徴として、組織やレクチン結合性による違いを見ることができます。

図7
図 7 糖タンパク質の詳細ページ(上)
糖タンパク質の糖鎖付加部位は、①サンプルの由来する組織や②回収に用いられたレクチン毎に表示されています。青いピンはIGOT法で同定された部位、赤いピン(丸で囲まれた例)はGlycoRidge法で同定された部位であることを示しています。
図8
図 8 糖タンパク質の詳細ページ(下)
糖タンパク質のアミノ酸配列と質量分析で同定されたペプチドの配列やレクチンとの対応表

同じレクチンで認識される糖鎖構造を持つ部位をサンプル間で比較すると、組織によって差があることが分かります。また、糖鎖を糖タンパク質から切り離すことなく解析(GlycoRidge法)した結果は赤いピン(図 7)で表示されています。赤いピンを選択することで、どんな糖鎖構造(糖鎖組成)を持っているかをビューワーにて見ることが可能です(図 9)。ビューワー上では同定された糖鎖の上にマウスオーバーすることで候補の糖鎖構造を表示します。すなわち、GlycoProtDBではN型糖鎖の付加部位の実際を知るだけでなく、糖鎖構造の違いをも含めて組織、細胞や血清による差を容易に見ることができるデータベースです。

図9
図 9 GlycoRidge法で同定された糖鎖構造のビューワーページ
糖タンパク質の同じ部位に存在する複数の糖鎖構造(組成)をGlycoRidge法によって同定し、表示しています。チャートの上にカーソルを移動すると組成から推測される糖鎖構造を見ることができます。
2-3. GlycoNAVI -TCarp

GlycoNAVIは糖鎖科学研究をサポートするためのウェブサイトです。ここでは生体高分子の立体構造データベースであるProtein Data Bank(PDB)11に含まれるデータを解析し糖鎖関連データを整理した二次データベース(TCarp)について紹介します。PDBには糖タンパク質、糖脂質、遊離糖鎖などの立体構造が収録されています。GlycoNAVIのトップページのGlycansサイトから糖鎖構造の一覧である図 10にアクセスすることができます。糖鎖構造は一覧表を順次閲覧するか、糖鎖構造リポジトリGlyTouCan12のアクセッション番号か糖鎖構造表記法であるWURCS13を入力することで検索することができます。GlyTouCanのアクセッション番号をクリックするとGlyTouCanのエントリーページが表示されます。

図10
図 10 糖鎖構造リポジトリGlyTouCanのアクセッション番号、糖鎖構造表記法WURCS、糖鎖構造のSNFG形式のリスト
左上のプルダウンで1ページの表示数の変更、右上のSearchで検索ができます。

図 10で目的の糖鎖構造のWURCS文字列をクリックすると、その糖鎖構造を含むエントリーページのリスト図 11が表示されます。このリストでは立体構造、GlyTouCanのアクセッション番号、糖鎖構造のSNFG形式(https://www.ncbi.nlm.nih.gov/glycans/snfg.html14が表示されます。先ほどと同様に左上のプルダウンで1ページの表示数の変更、右上のSearchで検索ができます。このリストにあるIDをクリックすると詳細ページが表示されます。

図11
図 11 WURCS文字列の糖鎖構造を含むリスト

また、GlycoNAVIのトップページのProteinsサイトから糖鎖構造の一覧である図 12にアクセスすることができます。このリストには含まれる糖鎖の数、PDBのタイトルなどが表示されます。先ほどと同様に左上のプルダウンで1ページの表示数の変更、右上のSearchで検索ができます。このリストにあるIDをクリックすると詳細ページが表示されます。

図12
図 12 詳細ページのリスト
PDBのタイトル、説明、PDBのID、立体構造が表示されます。

詳細ページでは、糖鎖構造を3D-SNFG15で描画した分子の三次元構造表示、PDBへのリンク、PDBエントリーのタイトル・説明、実験方法、解析日時(図 13)、GlyTouCanのアクセッション番号とリンク、糖鎖構造のSNFG表記、糖鎖の立体構造(図 14)、文献、PubMedへのリンクやデジタルオブジェクト識別子(DOI)とリンク(図 15)を得ることができます。また、図 16では、データ解析した際の糖鎖に関する検証結果を表示しています。この検証結果が表示されていると糖鎖の立体構造に注意すべき個所があることになります。

図13
図 13 詳細ページにおける糖鎖及び分子の立体構造とPDBにおけるタイトルと説明
図14
図 14 詳細ページにおける糖鎖構造とGlyTouCanアクセッション番号とリンク
図15
図 15 詳細ページにおける文献情報
図16
図 16 詳細ページにおける糖鎖分子の検証結果
2-4. GlycoPOST

GlycoPOSTは、糖タンパク質の質量分析データを投稿するためのリポジトリデータベースです。Webブラウザからhttps://glycopost.glycosmos.org/にアクセスして利用します(図 17)。ユーザーは、自身の実験データを登録することも、他のユーザーが登録したデータを閲覧・ダウンロードすることもできます。多くの場合、論文発表に際して関連する実験データを公開する目的で利用されます。 リポジトリに投稿されるデータは、実験条件などのメタデータとファイルです。メタデータの入力は、プルダウンメニューから選択したり、テキストボックスに記述して行います(図 18)。入力項目は、MIRAGE Project16の提唱する糖鎖関連実験を報告する際のガイドラインに準拠しているため、国際的に有用とされる基準を満たしていることになります。ガイドラインに準拠する他のデータベース・リポジトリサイトとの互換性もあり、Excelファイルを介してインポートおよびエクスポートが可能です。

投稿されるファイルは、質量分析計から出力された生データやピークリスト、同定結果などです。GlycoPOSTのファイルアップロードシステムは、独自に開発したPRESTOというJavaScriptライブラリを使用しており、Webブラウザの標準機能を拡張することで、従来より高速なアップロードを実現しています(図 19)。この機能により、データ投稿のすべてのプロセスをウェブブラウザだけで実施できるようになっています。

具体的な投稿手順や用語についてはhttps://glycopost.glycosmos.org/helpに解説しています。

図17
図 17 GlycoPOSTのトップページ
図18
図 18 メタデータ入力画面の一例
図19
図 19 ファイルの選択とアップロード

References
  • Bateman A, Martin MJ, O’Donovan C, et al. (2017) UniProt: the universal protein knowledgebase. Nucleic Acids Res 45:D158–D169 . doi: 10.1093/nar/gkw1099
  • Hosoda, M. et al. (2018) MCAW-DB: a glycan profile database capturing the ambiguity of glycan recognition patterns. Carbohydrate research 464, 44-56. doi: 10.1016/j.carres.2018.05.003
  • Watkins X, et al. (2017) ProtVista: visualization of protein sequence annotations. Bioinformatics 33(13):2040-2041. doi: 10.1093/bioinformatics/btx120
  • Kinjo AR, Bekker G-J, Wako H, et al. (2018) New tools and functions in data-out activities at Protein Data Bank Japan (PDBj). Protein Sci 27:95–102 . doi: 10.1002/pro.3273
  • Sehnal D, et al (2019) Rapidly Display Glycan Symbols in 3D Structures: 3D-SNFG in LiteMol. J Proteome Res 18(2):770-774. doi: 10.1021/acs.jproteome.8b00473
  • Fabregat A, Jupe S, Matthews L, et al. (2018) The Reactome Pathway Knowledgebase. Nucleic Acids Res 46:D649–D655 . doi: 10.1093/nar/gkx1132
  • Uhlén M, et al. (2015) Proteomics. Tissue-based map of the human proteome. Science 347(6220):1260419. doi: 10.1126/science.1260419
  • Sud M, et al. (2007) LMSD: LIPID MAPS structure database. Nucleic Acids Res 35(Database issue):D527-32
  • Kaji H, Shikanai T, Sasaki-Sawa A, Wen H, Fujita M, Suzuki Y, Sugahara D, Sawaki H, Yamauchi Y, Shinkawa T, Taoka M, Takahashi N, Isobe T, Narimatsu H. (2012). Large-scale identification of N-glycosylated proteins of mouse tissues and construction of a glycoprotein database, GlycoProtDB. J Proteome Res. 11, 4553-4566.
  • Noro E, Togayachi A, Sato T, Tomioka A, Fujita M, Sukegawa M, Suzuki N, Kaji H, Narimatsu H. Large-Scale Identification of N-Glycan Glycoproteins Carrying Lewis x and Site-Specific N-Glycan Alterations in Fut9 Knockout Mice. 2015 Sep 4;14(9):3823-34.
  • wwPDB consortium (2019) Nucleic Acids Res.Jan 8;47(D1):D520-D528. doi: 10.1093/nar/gky949.
  • Tiemeyer, M. et al. GlyTouCan: an accessible glycan structure repository. Glycobiology 27, 915–919 (2017). doi: 10.1093/glycob/cwx066.
  • Matsubara, M. et al. WURCS 2.0 update to encapsulate ambiguous carbohydrate structures. Journal of chemical information and modeling 57.4 632-637 (2017). DOI: 10.1021/acs.jcim.6b00650.
  • Neelamegham, S. et al. Updates to the Symbol Nomenclature for Glycans guidelines. (2019) Glycobiology Aug 20;29(9):620-624. doi: 10.1093/glycob/cwz045.
  • Thieker DF et al. 3D implementation of the symbol nomenclature for graphical representation of glycans. (2016) Glycobiology. Aug;26(8):786-7. doi: 10.1093/glycob/cww076.
  • Kolarich D, Rapp E, Struwe WB, et al. (2013) The minimum information required for a glycomics experiment (MIRAGE) project: improving the standards for reporting mass-spectrometry-based glycoanalytic data. Mol Cell Proteomics 12:991–5 . doi: 10.1074/mcp.O112.026492
top