MeSHを用いた新しいマイクロアレイ解析法@第82回日本生化学会大会

 2009年10月24日、表題に示しました学会での発表を終えてきました。たくさんのご意見を頂けて、とても有意義な時間を過ごせましたが、さらに多くのご意見を頂きたいと考え、内容をここに公開します。

MeSHを用いた新しいマイクロアレイ解析法
第82回日本生化学会大会 4T6a-12 (4P-471)


①解析法の目的
 マイクロアレイ実験を行うと、多くの遺伝子の発現比データを得ることができます。このデータから、未知のバイオマーカーの探索ができることは言うまでもありません。しかし、マイクロアレイのデータを活かす方法はこれだけでしょうか。

 マイクロアレイにより得られる膨大なデータを活かして、検出された遺伝子発現変動から、これが全体としてどのような変化を示しているかを捉える(機能的に解析する)ことは重要です。しかし、その方法はまだ十分には確立されていません。マイクロアレイのデータを機能的に解析するということは、すなわち、発現変動した遺伝子に共通の機能を見出すことです。そのための方法として、これまでにGene Ontology(GO=遺伝子オントロジー)を用いた方法や、経路解析といった方法がよく用いられてきました。
 私たちは、これに加えてMedical Subject Headings (MeSH=医学主題見出し用語;NLM=米国国立医学図書館が医学文献の分類に用いている主題見出し用語)を用いて行う新しいマイクロアレイ解析法を提案しています。

 GO及びMeSHは、生物学的意義を表すことのできる用語です。これらを、マイクロアレイにより解析できる遺伝子に付与(アノテーション)することにより、マイクロアレイのデータが示す生物学的意義を推測することが、本解析法の目的です。

 以下に、方法の概要や参考文献を示します。この方法を改善し、新しい解析法として確立するために、多くのデータのセットをこの解析法に適用したり、多くのご意見を取り入れたりしたいと考えています。


②方法の概要

1) 必要なもの
  マイクロアレイデータ(当然ですね。)
   発現比又は差
   データの信頼性を示す値
   (P値又はSD、シグナル強度値など)
  各遺伝子のAcc. No.又はUnigene IDなど
   (遺伝子のIDがリスト中にあると、各遺伝子に
    対するタームの付与が容易になる。)
  必要なデータベースにアクセスできる環境

2) 各遺伝子にアノテーションされるGOタームとMeSHタームを検索する。
 ⇒アノテーションをした遺伝子リストを作成する。
 ・・・私たちは、PubGeneというデータベースを用いてこれを行いました。遺伝子にMeSHをアノテーションできるデータベースは、他には多くはないと思います。

3) アノテーションをした遺伝子リストに、発現比(など)のデータを付け加える。

4) 発現比やデータの信頼性を考慮しながら、発現変動した遺伝子にどのタームが持ったものが多いかを解析する。
 Excelで解析する場合は、DCOUNT機能を使い、マクロを組むことにより容易に解析を行うことができます。この解析シートの作成は、情報処理やプログラミングが専門でない私には容易ではありませんでしたが、決して難しいものでもありません。ご興味をお持ちの方はご連絡下さい。

5) 統計処理により、発現変動した遺伝子にはどのタームを持つものが多いかを解析する。
 私たちは、超幾何分布に基づいた正確確率検定により、抽出されるタームの有意性を検討しました。


③得られる結果

 MeSHは遺伝子に、組織や関連する疾患などの情報をアノテーションできます。このMeSHを用いてマイクロアレイのデータを解析することにより、このデータに対しても、GOのみを用いた解析では得られない情報を得ることができました。

 ~得られるのは答えではなく『ヒント』~

 この解析法により得られた結果は、マイクロアレイ実験から得られた膨大なデータのうち、どこに注目して研究を次のステップに進めれば良いかのヒントを与えてくれます。逆に、ある事象の変化の証拠を直接的に示す証拠とはなりません。得られた結果をヒントにして次の解析を行っていくことが、重要になると考えています。
 私が実際のマイクロアレイデータに適用した例を、下にお示しする2つの原著論文で報告しました。


④今後の展望

 MeSHを用いて遺伝子を分類し、マイクロアレイのデータを解析するという方法は、2年前に仲里猛留氏(現・ライフサイエンス統合データベースセンター)により提唱されており、解析ソフトの開発も始められています (Nakazato et al. In Silico Biol, 2007) 。私たちは、MeSHを用いたマイクロアレイデータの解析を、Excelで容易にできる方法を確立することを目指しています。誰でも情報・機能を付け加えながら、自分の必要なデータを得ることのできる方法を作り上げたいと考えています。
 私は、情報系を専門にしているわけではなく、生化学実験を行う方が専門のものです。自分のデータを解析するために、ひとまずこの方法を自分で使える形にはしました。しかし、この方法を有用なものとして確かなものにするためには、多くのデータのセットをこの解析法に適用し、結果をフィードバックして本法を改善していくことが必要です。


 最後になりますが、本日はたくさんの方とお話させて頂き、ご意見を頂くことができました。情報系がご専門の方、生化学実験をされている方、マイクロアレイのデータ解析をお仕事にされている方、マイクロアレイを触り始めたばかりの方・・・ いろいろな方とお話できて、有意義な発表にすることができました。感謝申し上げます。


<参考>

・GO (Gene Ontology)
 遺伝子の機能に基づいて、Gene Ontology Consortiumにより遺伝子に付与される用語です。すべての用語は、Molecular Function、Biological Process、Cellular Componentの三大カテゴリに分類されます。マイクロアレイデータの機能的解析に、すでに汎用されています。

・MeSH (Medical Subject Headings)
 PubMedを公開している米国国立医学図書館(NLM)が、医学文献を分類するために用いている主題見出し用語です。用語は組織や疾患、生命現象などをカバーしています。文献を分類する用語であり、元々は遺伝子を分類できるものではありませんが、私たちはデータベースPubGeneを用いることにより、各遺伝子に対するMeSHのアノテーションを可能にしました。
 マイクロアレイデータの解析をMeSHを用いて行うことの利点は、遺伝子に発現局在や関連する疾患を示す情報をアノテーションできる点にあります。

・PubGene
 遺伝子と各ターム(GOターム、MeSHタームなど)について、論文上の共起性の強さを示したデータベースです。

「ナノ粒子健康科学研究センター」研究報告会
 私の提案する方法に独特の点とその方法により得られた成果(2011年3月8日)

<参考文献>
 Umezawa M. et al. Microarray analysis provides insight into early steps of pathophysiology of mouse endometriosis model induced by autotransplantation of endometrium. Life Sci 84: 832-837 (2009)
 Shimizu M. and Umezawa M. et al. Maternal exposure to nanoparticulate titanium dioxide during the prenatal period alters gene expression related to brain development in the mouse. Part Fibre Toxicol 6:20 (2009)
 Nakazato T. et al. Biocompass: a novel functional inference tool that utilized MeSH hierarchy to analyze groups of genes. In Silico Biol 8: 53-61 (2007)

 

f:id:umerunner:20191001233018j:plain