miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定
-
Upload
y-h-taguchi -
Category
Science
-
view
368 -
download
2
Transcript of miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定
miRNAmRNA相互作用同定を用いた
腎芽腫関連遺伝子の推定
田口善弘
中央大学・物理学科
本研究はBIBE2016で発表したものです。
http://biorxiv.org/content/early/2016/08/30/059295http://bibe2016.asia.edu.tw/
DOI 10.1109/BIBE.2016.14
研究の動機:
がんの原因遺伝子、バイオマーカーなどを患者と健常者の間で発現差が大きい遺伝子から選ぼうという試みはよくなされている。
しかし、擬陽性(False Positive, FP)の多さが大きな問題になっている。
近年はマルチオミックスデータで絞りこみを行おうという動きが増えてきている。
本研究ではmRNAとmiRNAの発現量から統合解析を行うことでガン関連遺伝子・バイオマーカーのFPを減らすことを試みる
特に腎芽腫は遺伝子の突然変異と関係付けられていないのでエペジェネティックすを考慮する価値がある
microRNA (miRNA)とは?
DNA
mRNA
protein
miRNA
miRNAmRNA 相互作用の予測には困難が伴う
*ペアの数、多すぎ
mRNA 〜 104, miRNA 〜 103 → pairs 〜 107 *情報科学的な予測はあるが配列ベース
どうすればいい?発現差(differential expression, DE)を用いてあらかじめmRNA/miRNAをスクリーニングしておく。 例:疾患関連 miRNAmRNA ペア
→ mRNA/miRNA 有意なDEだけを考慮
mRNA miRNA
健常者
患者
マッチング
負相関健常者
患者
問題点 ”有意な”有意なDE” DE” に任意性ありすぎ。
スクリーニングの基準: P値とFoldChange:FC
P値:mRNA/miRNAの数はNで固定だがサンプル数Mは変化する M:大 → P:小
FC:典型的なしきい値: 2 or ½, バイアスはないか?
先行研究の実施例
significant DEsignificant DEcancers
Previous studies
None
No mention
現実には.... Pvalue and FC を調整→ よい結果これでいいのかの議論はなし
生物学的に生物学的にOKOKならならOKOKなの?なの?
(No discussion about Pvalue and FC)
→”有意な DE のあるmRNA/miRNAはどれか?”
→本当の答えはあるはずだが....
→ データ駆動型のアプローチなら恣意性を回避可能
主成分分析(PCA)を用いた教師なし学習による変数選択とは?
N 変数(遺伝子)
カテゴリ多クラス分類
普通のPCAではサンプルを埋め込むが今回は変数(遺伝子)の方を低次元( Q 次元)に埋め込む.
PC
A
PC1
サンプル主成分負荷量
M サンプルN × M 行列 X (実数値)
PC2
PC1
主成分得点
++ ++ +
+++
++ ++ ++
+
群間で発現に差異なし
人工データによるデモ
10 サンプル10 サンプル
90 変数(遺伝子) 10 変数(遺伝子)
N(0)N()
[N()+N(0)]/2
+:Top 10 外れ値外れ値を選べば教師なし学習的に二群に差があるものをみつてられる精度精度(100 (100 試行平均試行平均)) 89.5% ( 52.6% (
PC1
PC2
正規分布 μ:平均 ½ :標準偏差
主成分分析主成分分析(PCA)(PCA)を用いた教師なし学習による変数選択を使えばを用いた教師なし学習による変数選択を使えば
mRNA/miRNA, N固定M:可変, M → ∞で収束するものは?
⇓主成分得点(遺伝子)の方は M → ∞ で収束する?
M(≪N)サンプル
遺伝子発現行列
主成分負荷量( M → ∞で収束)
健常者
患者
PC1M
N
PC1
PC2
ガウス分布仮定
cf.確率主成分分析
主成分得点 外れ値*
||選択
有意性検定:T test:P<0.05
*:多重ガウス分布+χ2 分布BH 法補正したP value<0.01
N(m
RN
A/m
iRN
A)
第46回バイオ情報学研究会(2016年7月沖縄)では、この枠組みで多数のがん種に対して統一的にP<0.01という基準「だけ」でmiRNAとmRNAをスクリーニングすることで生物学的に意味があるmiRNA-mRNAペアの検出に成功したことを報告済み。今回はそれを腎芽腫に使う。
mRNA miRNA
mRNAsmiRNAs
外れ値
miRTarBase
変数(遺伝子)埋め込み
miRNAmRNA
ペア
逆相関ペア
vs
発現行列
健常者
患者
実験ベースの既知の相互作用データベース
結果結果 ::サンプルサンプル : (Ludwig et al, IJMS, 2016): (Ludwig et al, IJMS, 2016)
mRNA miRNA患者 健常者
(P)atients (N)ormal P N28 4 62 4
選択選択
mRNA 1114 miRNA 55
線形判別 線形判別 (PCA+LDA+LOOCV)(PCA+LDA+LOOCV)mRNA miRNAP N P N
P 2727 0 6161 0N 1 44 1 44
R=-0.126 (P=0.008)
R=-0.267 (P<1016)
3,42
複数個の複数個のmiRNAmiRNAの標的になっている遺伝子の生存曲線の標的になっている遺伝子の生存曲線解析(解析(OncoLnc.org, BoldOncoLnc.org, Bold::Kidney cancersKidney cancers))
3,4
2
Kaplan plot for CBX2 in KIRPLogrank p-value=0.000471
Kaplan plot for IGF2 in KIRPLogrank p-value=0.011
Kaplan plot for CCND1 in KIRCLogrank p-value=0.000285
Kaplan plot for RPL12 in KIRCLogrank p-value=0.000577
結論結論 ::
mRNA と ,miRNA の 発 現 量 の 統 合 解 析 と mRNAmiRNA 相互作用の組み合わせで 生生物学的に妥当性の高い物学的に妥当性の高い mRNAsをmRNAsの発現差だけ発現差だけから選択するよりもずっとうまく選ぶことができた。
今後、バイオマーカー、疾患関連遺伝子の同定に広く活用されることが期待される。