Aug. 01, 2019

糖鎖関連遺伝子のデータベースの現状
(GGDB, FlyGlycoDB)
(2019 Vol.22 (3), A7)
DOI:10.32285/glycoforum.22A7J

赤瀬 幸子 / 安形 清彦

赤瀬 幸子

氏名:赤瀬 幸子
創価大学 工学部 生命情報工学科を卒業し、現在、創価大学大学院 工学研究科 博士前期課程で、木下聖子教授のもと糖鎖情報科学について学んでいます。糖鎖遺伝子から糖鎖合成を予測できるWebツール「GlycoSim」の開発に従事し、FlyGlycoDBに登録されている遺伝子を用いたショウジョウバエのN型糖鎖合成シミュレーションを行なっています。

安形 清彦

氏名:安形 清彦
筑波大学大学院 生物科学研究科で学位取得後、La Jolla Cancer Research Foundation(現Sanford Burnham Prebys Medical Discovery Institute)にて、福田穰教授のもとで糖鎖生物学の研究について学ぶ。現所属(産総研)では、糖鎖遺伝子の発現解析、糖鎖の新しい機能の解析や糖鎖の応用について研究するとともに糖鎖DB(ACGG-DB)の開発に参画しています。

1. 序文

本シリーズの第3回では、糖鎖関連遺伝子のデータベースについて説明いたします。糖鎖の合成に関わる遺伝子(糖鎖関連遺伝子, glycogene)には、糖ヌクレオチド合成酵素・糖ヌクレオチドトランスポーター・糖転移酵素などの合成のための関連分子や分解のために必要なグリコシダーゼの遺伝子が含まれています。ヒトでは約300遺伝子ほどが糖鎖の合成や分解に関与していますが、生物の進化において数や構成している遺伝子の多様性も異なっています。ここでは、先ず糖鎖関連遺伝子の研究に有用と思われるデータベース(DB)について紹介し、筆者らが公開しているデータベース(GGDBとFlyGlycoDB)の特徴についても紹介します。

2. 糖鎖遺伝子データベース

糖鎖研究はこれまでの糖鎖の構造や生合成から、微生物学、発生生物学、免疫学や腫瘍学など多分野から糖鎖の機能を明らかにする研究が増えています。そこで、これまで糖鎖研究を実施していなかった研究者にとって、様々な情報を集約したDBは糖鎖研究を進める上で論文を読むのと同様に役に立つと考えられます。仮に糖鎖遺伝子名が論文や解析結果に出て来た場合、糖鎖遺伝子についての手掛かりとして一般的な遺伝子やタンパク質のDBや知識ベース(knowledge base, KB)も利用できますが、糖鎖遺伝子の情報収集のための手段としてここで紹介する糖鎖関連DBも公開されており、それぞれのDBの特徴を活かした利用が有効です。

例えば、糖鎖遺伝子のcDNAやゲノム構造などの配列の取得には、geneEnsemblCAZyがあります。特にCAZyは様々な生物種の糖鎖遺伝子を網羅しており、生物種間の比較や進化的な解析に有用です。病気との関係を調べるには、OMIM(https://www.ncbi.nlm.nih.gov/omim, https://omim.org)やHuman Protein Atlasが有用です。Human Protein Atlasでは癌組織での糖鎖遺伝子の発現量を見ることができます。タンパク質としての解析には、KEGGUniProtKBGlyGenGeneCardsなどが用いられ、パスウエイ、質量分析やインタラクトームの解析結果にアクセスすることができます。


2-1. GGDB: glycogene database

ヒトではこれまでに約300個の糖鎖関連遺伝子がクローニングされています。これらのうち糖鎖合成に関わる遺伝子に着目したデータベースがGlycoGene Database(GGDB)で、日本糖鎖科学総合データベース(JCGGDB)の一つとして公開されました。現在では表示方法などインターフェースや記載内容などにも変更を加えた最新版をACGG内で公開していますが(https://acgg.asia/db/ggdb/, Narimatsu et al. 2017)、ここではその特徴について紹介いたします。

※ GGDBはACGGからだけではなく、日本糖鎖科学コンソーシアム(JCGG)GlyCosmosポータルからも訪れることが出来ます。

現在、221個の糖鎖合成に関与する糖鎖遺伝子をリストしていますが、トップページでは糖鎖遺伝子がアルファベット順に並べられ酵素反応やキーワードが簡単に見ることができます(図 1)。

図1
図 1 GGDBのトップページ
A. 糖鎖遺伝子がアルファベット順に表示されます。
B. テキスト検索とファセット検索によって糖鎖遺伝子を絞り込むことができます(図2参照)。糖鎖遺伝子を選択すると新しいタブで表示されるので、簡単に検索ページに戻ることもできます。

また、検索モードとして、テキスト検索に加えファセット検索を用意してありますので絞り込み検索が簡単にできます(図 2)。

図2
図 2 GGDBの検索ツール
テキスト検索に加えファセット検索(Family, Pathway, Keyword, Donor, Expression)が可能です。各項目は拡張表示して選択することや、複数の項目を選択して糖鎖遺伝子の絞り込みが容易にできます。

次に選択した糖鎖遺伝子のページを説明します。

選択された糖鎖遺伝子の各ページでは、サマリーと主な酵素反応が前駆体、基質(糖ヌクレオチド)と反応産物が図で示されています(図 3)。GGDBを含めたACGG-DBの共通の特徴は、全てのデータベースが糖鎖の構造という共通言語(JCGG-STR)を用いているということです。上述の一般的なDBでは文字による記載のみであるのに対して、直感的に反応産物をイメージできることが特徴の一つです。サマリーは産業技術総合研究所(産総研)の糖鎖研究者がキュレーションを担当しており、酵素反応や機能を簡単にまとめてあります。

図3
図 3 選択した糖鎖遺伝子のページの上段
A. 表示遺伝子の酵素反応や機能についてのサマリーとキーワードを記載しています。
B. 主な酵素反応を構造で示しています。酵素反応の基質は矢印の下に表示されています。各構造の下にあるJCGG-STR番号をクリックするとJCGGDBのサイトに移動して組成や質量などの情報を見ることができます。

遺伝子名はHGNCでの命名を採用しています。これまでに使用されている通称はエリアス内に収納されています。糖鎖研究の長い歴史の中で糖鎖遺伝子には様々な名前がつけられています。例えばFUT4遺伝子は生成物であるCD15に因んでCD15遺伝子と呼ばれていたので、エリアス内に別名として入れてありますが、混乱を避けるために今後の使用は避けるべきで、参考のために記載しています(図 4)。

図4
図 4 選択した糖鎖遺伝子のページの中段
GGDBにおける糖鎖遺伝子名(シンボル名)と酵素活性に由来する名称を示しています。歴史的に用いられていた名称はエリアス内に記載しています。上述のgeneやOMIMなどの参考サイトがリンクされているので、GGDBとは異なるDBの情報を得るときに便利です。

中段以降では、相同遺伝子(図 5)、酵素反応やmRNA発現(図 6)、リーソース(図 7)などの情報を取得することができます。

図5
図 5
マウスやラットの相同遺伝子情報も入手可能です。特にMGI(Mouse Genome Informatics)はマウス遺伝子の情報や機能情報も入手できます。
図6
図 6
A. アクセプターの情報を酵素反応(図式)や文献から取得した表を提示しています。
B. 同様にmRNAの発現情報も文献情報とともに見ることが出来ます。
図7
図 7
リソース欄には製品評価技術基盤機構(NITE)へのリンクが貼られており、産総研で作製された糖鎖遺伝子のGatewayTMエントリークローンを入手することが可能です。

2019年現在でも、新しい糖鎖遺伝子あるいは糖鎖遺伝子の活性や機能が報告されていますので、サマリーの更新や酵素反応の改定も定期的に必要です。また、糖鎖合成パスウエイに関わる糖鎖遺伝子の変異や発現量の情報は、糖鎖の異常を伴う疾病や癌などの研究にも有用と考えられます。今後はGlyCosmos内での連携を進めることによって、他のDBとの横断的な利用を開発する予定です。


2-2. FlyGlycoDB

キイロショウジョウバエ(学名: Drosophila melanogaster、以下ショウジョウバエ)の糖鎖関連遺伝子のデータベースであるFlyGlycoDBは、http://fly.glycoinfo.org/から利用することができます。ショウジョウバエは、糖鎖研究に限らず、多くの生物学的研究において、古くからモデル生物として用いられてきました。ショウジョウバエの遺伝学的実験結果をまとめたデータベースFlyBase(Thurmond et al. 2019)は、ショウジョウバエで発見されている全遺伝子を格納していますが、その中から糖鎖関連遺伝子を抽出するのは難しく、ショウジョウバエの糖鎖関連遺伝子のみに着目したデータベースは存在していませんでした。そこで、糖鎖研究の視点から利用しやすいデータベースとして、FlyGlycoDBが開発されました。FlyGlycoDBでは現在、RNAiサイレンシングを用いた解析によって活性が確認された遺伝子(Nishihara et al. 2007, 2010; Yamamoto et al. 2015)、および糖関連酵素データベースCAZy(Lombard et al. 2014)から取得した遺伝子など、計160の機能同定されたショウジョウバエ糖関連遺伝子が登録されています。FlyGlycoDBのトップページを図 8に、各遺伝子のエントリーページを図 9に示します。

図8
図 8 FlyGlycoDBのトップページ
Aに遺伝子の一覧が表示され、CG numberをクリックすると、各遺伝子のエントリーページを閲覧することができます。Bのテキストボッスクからはテキストでの検索が可能です。Cの項目を選択するとフィルタリングが行われ、選択した項目に該当する遺伝子のみがAに表示されます。
図9
図 9 FlyGlycoDBのエントリーページ
例としてCG8824のページを示しています。AではFlyGlycoDBに保存されている、Gene Name、NCBI Gene ID、FlyBase ID、Mutant Stack in FlyBase (Exists/None)、Protein Name、Protein Family、Mammalian Orthologue、Mutant Name、Activity Name、Substrate、Whole-body gene silencing phenotype (Lethal/Viable/Not Tested)についての情報を確認することができます。BにはSwissProtに登録されている情報が表示されます。

FlyGlycoDBはセマンティックウェブ化されているため、外部のデータベースとの連携を容易に行うことができます。そのためエントリーページでは、選択された遺伝子について、FlyGlycoDBに保存されている情報だけでなく、SwissProtの情報も表示できるようになりました。

また、2019年8月1日より、アップデートされたFlyGlycoDBが、GlyCosmosから利用できます。GlyCosmos Data Resources下にて、分類された全166エントリーのショウジョウバエ糖関連遺伝子が閲覧可能です。


References
  • Lombard V, Golaconda Ramulu H, Drula E, et al (2014) The Carbohydrate-active enzymes database (CAZy) in 2013. Nucleic Acids Res 42:D490–D495 . doi: 10.1093/nar/gkt1178
  • Narimatsu, H., Suzuki, Y., Aoki-Kinoshita, K., Fujita, N., Sawaki, H., Shikanai, T., Sato, T., Togayachi, A., Yoko-o, T., Angata, K. Kubota, T., and Noro, E. (2017) Glycogene Database (GGDB) on the Semantic Web. In: A Practical Guide to Using Glycomics Databases (Aoki-Kinoshita, K. ed.), Springer Japan, p163-175.
  • Nishihara S (2007) 4.05-Drosophila development, RNAi, and glycobiology. Comprehensive Glycoscience. In: Chemistry to Systems Biology. Elsevier, Oxford, pp 49-79
  • Nishihara S (2010) Glycosyltransferases and transporters that contribute to proteoglycan synthesis in Drosophila: Identification and functional analyses using the heritable and inducible RNAi system. In: Method in Enzymology. Academic Press, pp 323-351
  • Thurmond J, Goodman JL, Strelets VB, et al (2019) FlyBase 2.0: the next generation. Nucleic Acids Res 47:D759–D765 . doi: https://doi.org/10.1093/nar/gky1003
  • Yamamoto-Hino M, Yoshida H, Ichimiya T, et al (2015) Phenotype-based clustering of glycosylation-related genes by RNAi-mediated gene silencing. Genes Cells 20:521-542 . doi: 10.1111/gtc.12246.
top