miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

21
miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定 田口善弘 中央大学・物理学科 本研究はBIBE2016で発表したものです。 http://biorxiv.org/content/early/2016/08/30/059295 http://bibe2016.asia.edu.tw/ DOI 10.1109/BIBE.2016.14

Transcript of miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

Page 1: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

miRNA­mRNA相互作用同定を用いた

腎芽腫関連遺伝子の推定

田口善弘

中央大学・物理学科

本研究はBIBE2016で発表したものです。

http://biorxiv.org/content/early/2016/08/30/059295http://bibe2016.asia.edu.tw/

DOI 10.1109/BIBE.2016.14

Page 2: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

研究の動機:

がんの原因遺伝子、バイオマーカーなどを患者と健常者の間で発現差が大きい遺伝子から選ぼうという試みはよくなされている。

しかし、擬陽性(False Positive, FP)の多さが大きな問題になっている。

近年はマルチオミックスデータで絞りこみを行おうという動きが増えてきている。

本研究ではmRNAとmiRNAの発現量から統合解析を行うことでガン関連遺伝子・バイオマーカーのFPを減らすことを試みる

特に腎芽腫は遺伝子の突然変異と関係付けられていないのでエペジェネティックすを考慮する価値がある

Page 3: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

microRNA (miRNA)とは?

DNA

mRNA

protein

miRNA

Page 4: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

miRNA­mRNA 相互作用の予測には困難が伴う

*ペアの数、多すぎ

 mRNA 〜 104, miRNA 〜 103 → pairs 〜 107 *情報科学的な予測はあるが配列ベース

Page 5: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

どうすればいい?発現差(differential expression, DE)を用いてあらかじめmRNA/miRNAをスクリーニングしておく。  例:疾患関連 miRNA­mRNA ペア

 → mRNA/miRNA 有意なDEだけを考慮

mRNA miRNA

健常者

患者

マッチング

負相関健常者

患者

Page 6: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

問題点 ”有意な”有意なDE” DE”   に任意性ありすぎ。

スクリーニングの基準: P­値とFoldChange:FC

P­値:mRNA/miRNAの数はNで固定だがサンプル数Mは変化する M:大 → P:小

FC:典型的なしきい値: 2  or ½, バイアスはないか?

Page 7: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

先行研究の実施例

significant DEsignificant DEcancers

Previous studies

None

No mention

Page 8: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

現実には.... P­value and FC を調整→ よい結果これでいいのかの議論はなし

生物学的に生物学的にOKOKならならOKOKなの?なの?

(No discussion about P­value and FC)

→”有意な DE のあるmRNA/miRNAはどれか?”

→本当の答えはあるはずだが....

→ データ駆動型のアプローチなら恣意性を回避可能

Page 9: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

主成分分析(PCA)を用いた教師なし学習による変数選択とは?

 N 変数(遺伝子)

カテゴリ多クラス分類

普通のPCAではサンプルを埋め込むが今回は変数(遺伝子)の方を低次元( Q 次元)に埋め込む.

PC

A

PC1

サンプル主成分負荷量

M サンプルN × M 行列 X (実数値)

PC2

PC1

主成分得点

++ ++ +

+++

++ ++ ++

+

群間で発現に差異なし

Page 10: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

人工データによるデモ

10 サンプル10 サンプル

90 変数(遺伝子) 10 変数(遺伝子)

N(0)N()

[N()+N(0)]/2

+:Top 10 外れ値外れ値を選べば教師なし学習的に二群に差があるものをみつてられる精度精度(100 (100 試行平均試行平均)) 89.5% ( 52.6% (

PC1

PC2

正規分布 μ:平均 ½ :標準偏差

Page 11: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

主成分分析主成分分析(PCA)(PCA)を用いた教師なし学習による変数選択を使えばを用いた教師なし学習による変数選択を使えば

mRNA/miRNA, N固定M:可変,  M → ∞で収束するものは?

⇓主成分得点(遺伝子)の方は M → ∞ で収束する?

Page 12: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

M(≪N)サンプル

遺伝子発現行列

主成分負荷量( M   → ∞で収束)

健常者

患者

PC1M

N

PC1

PC2

ガウス分布仮定

cf.確率主成分分析

主成分得点 外れ値*

||選択

有意性検定:T test:P<0.05

*:多重ガウス分布+χ2 分布BH 法補正したP value<0.01

N(m

RN

A/m

iRN

A)

Page 13: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

第46回バイオ情報学研究会(2016年7月沖縄)では、この枠組みで多数のがん種に対して統一的にP<0.01という基準「だけ」でmiRNAとmRNAをスクリーニングすることで生物学的に意味があるmiRNA-mRNAペアの検出に成功したことを報告済み。今回はそれを腎芽腫に使う。

Page 14: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

mRNA miRNA 

mRNAsmiRNAs

外れ値

miRTarBase

変数(遺伝子)埋め込み

miRNA­mRNA 

ペア

逆相関ペア

 vs 

発現行列

健常者

患者

実験ベースの既知の相互作用データベース

Page 15: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

結果結果 ::サンプルサンプル : (Ludwig et al, IJMS, 2016): (Ludwig et al, IJMS, 2016)

mRNA miRNA患者   健常者     

(P)atients (N)ormal P N28 4 62 4

選択選択

mRNA 1114 miRNA 55

                                  線形判別 線形判別 (PCA+LDA+LOOCV)(PCA+LDA+LOOCV)mRNA miRNAP N P N

P 2727 0 6161 0N 1 44 1 44

Page 16: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

R=-0.126 (P=0.008)

R=-0.267 (P<10­16)

Page 17: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

3,42

Page 18: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

複数個の複数個のmiRNAmiRNAの標的になっている遺伝子の生存曲線の標的になっている遺伝子の生存曲線解析(解析(OncoLnc.org, BoldOncoLnc.org, Bold::Kidney cancersKidney cancers))

3,4

Page 19: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

2

Page 20: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

Kaplan plot for CBX2 in KIRPLogrank p-value=0.000471

Kaplan plot for IGF2 in KIRPLogrank p-value=0.011

Kaplan plot for CCND1 in KIRCLogrank p-value=0.000285

Kaplan plot for RPL12 in KIRCLogrank p-value=0.000577

Page 21: miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定

結論結論 ::

mRNA と ,miRNA の 発 現 量 の 統 合 解 析 と mRNA­miRNA 相互作用の組み合わせで 生生物学的に妥当性の高い物学的に妥当性の高い mRNAsをmRNAsの発現差だけ発現差だけから選択するよりもずっとうまく選ぶことができた。

今後、バイオマーカー、疾患関連遺伝子の同定に広く活用されることが期待される。