化学系・生物系の計算モデル -...
Transcript of 化学系・生物系の計算モデル -...
化学系・生物系の計算モデル
計算モデルの研究(萩谷研究室)
計算モデル 論理 人工物
安心・安全
自然現象
あやしい あぶない
解析 設計
検証 抽出
分子・量子 生物
λ計算 並行計算 グラフ書換
生物に触発された計算 自然計算 分子計算 量子計算
ソフトウェア プロトコル
DNAロボット 暗号プロトコル
最近の研究プロジェクト ・ 分散処理ミドルウェアの検証(モデル検査)(産総研・情報学研究所との共同研究) ・ 分子ロボティクス・合成生物学およびそのための計算モデル・情報環境(川又) ・ 量子(鍵配送・投票)プロトコルの検証(角谷・久保田)
DNAシステムの グラフ書き換えモデル
DNAシステムのモデル
• DNAの立体構造 --- 二本鎖の螺旋構造 – 第一原理計算(量子化学) – 分子動力学
第一原理計算(量子化学)
http://www.advancesoft.jp/service/analysis/analysis_02.html
分子動力学
http://ambermd.org/tutorials/basic/tutorial1/
DNAシステムのモデル
• DNAの立体構造 --- 二本鎖の螺旋構造 – 第一原理計算(量子化学) – 分子動力学
• DNAの二次構造 – どのベースとどのベースがつながっているか – ヘアピンなどの様々なループ構造
• まとまったセグメント単位の二次構造 – グラフ – 多くのDNAシステムはこのレベルでモデル化可能
水素結合 ハイブリダイゼーション
ATACCAACAATAGTAACAGAC
TTGTTATCATTGTCTG
c b a d
B C D
c d
グラフ=分子
c b a d
B C D
c d ノード(節・頂点)
エッジ(辺)
エッジ(矢)
ATACCAACAATAGTAACAGAC
TTGTTATCATTGTCTG
c b a d
B C D
c d
ATACCAACAATAGTAACAGAC
TTGTTATCATTGTCTG
c b a d
B C D
c d
ATACCAACAATAGTAACAGAC
TTGTTATCATTGTCTG
AGTAACAGAC
c b a d
B C D
c d
グラフの書き換え
c b a d
B C D
c d
グラフの書き換え
c b a d
B C D
c d
グラフの書き換え
c b a d
B C D
c d
グラフ書き換え規則
y
x
X Y
y
y
x
X Y
y
三種類の反応
c A
C
A
c a
C A
a A
• Hybridization • Denaturation • Branch migration
c A
C
A
c a
C A
a A
• Hybridization • Denaturation • Branch migration
三種類の反応
c A
C
A
c a
C A
a A
• Hybridization • Denaturation • Branch migration
三種類の反応
三種類の反応
c A
C
A
c a
C A
a A
• Hybridization • Denaturation • Branch migration
c A
C
A
c a
C A
a A
• Hybridization • Denaturation • Branch migration
三種類の反応
c a A
C A
A
c a
C A
• Hybridization • Denaturation • Branch migration
三種類の反応
Branch Migration
y
x
X Y
y
y
x
X Y
y
Hybridization
x
X
x
X
Hybridization
x
X Y
y
x
X Y
y
Denaturation
x
X
x
X
マルチセット書き換え
化学反応のモデル
• 濃度大 – 連続濃度に対する微分方程式
• 少分子 – マルチセット書き換え系
• マルチセットの要素=分子=グラフ – 確率マルチセット書き換え系
• 確率微分方程式(マスター方程式)
連続濃度に対する微分方程式
22
21 2 RGkBRk
dtdG
−=
1k
2k
マルチセット書き換え系
確率的マルチセット書き換え系
propensity 11
423
c
222
12
c
1c
2c
マスター方程式
rrggbbbrggggbbbrrrgbbbbrrggbbb pccpcpcdt
dp
+
−
+
= 2121 2
212
13
22
24
11
14
23
確率的マルチセット書き換え系
propensity11
423
c
222
12
c
1c
2c解析的に 調べるのは 一般に困難
Gillespie法とτ跳躍法
• 確率的シミュレーションの標準的手法 – 各々の書き換え規則(反応)は、 propensityに比例した確率で実行される – a0 をpropensityの和としたとき、 いずれかの規則が今から時間 t のうちに 実行される確率は 1−e−a0t
Gillespie法
今から時間 t の間に実行されない 確率を P(t) とすると、P(0) = 1 で、 dP(t) = −a0 P(t) dt
1
r
t
縦軸に 0 から 1 まで一様に乱数を生成すると、 1-r から 1 までに入る確率は r。これは、ちょうど、 時刻 t までに反応が起こる確率に等しい。
1−e−a0t
0
• 確率的シミュレーションの標準的手法 – 各々の書き換え規則(反応)は、 propensityに比例した確率で実行される – a0 をpropensityの和としたとき、 いずれかの規則が今から時間 t のうちに 実行される確率は 1−e−a0t
• Gillespie法の各ステップ – [0,1] の一様乱数 r から (1/a0)ln(1/r) によって 次の書き換えの時刻を決定 – 乱数を用いてpropensityに比例して規則を選択
Gillespie法
今から時間 t の間に実行されない 確率を P(t) とすると、P(0) = 1 で、 dP(t) = −a0 P(t) dt
1− e−a0t = 1−r
分子種 i の個数が Xi
τ跳躍法
• Gillespie法の効率化 • 分子数がある程度大きい場合、 数回の反応では分子数は大きく変化しない • 適当な時間間隔 τ の間に
propensityが a の反応が起こる回数 n は、
平均 aτ のPoisson分布に従う
例
• 遺伝子と制御タンパクのモデル
抑制された遺伝子
遺伝子
タンパク
0.1 1.0 0.0001 0.001
0.1 1.0 0.0001 0.001
0.1 1.0 0.0001 0.001
去年のレポート課題
B C
b
c a
A C
T1
T2
t2 B A t1 Input 2 Input 1
DNA Automaton
想定する反応
• 2分子(構造)の間の相補鎖のhybridization – 連続する相補鎖は一度に結合。 – Denaturationはなしとする。
• 1分子(構造)内のbranch migration
課題(ボトムライン)
• ストランド投入の順序が以下の場合について 生成される構造をすべて数え上げよ。
– 入力以外の混合 – Input1投入 – Input2投入
反応のパラメータ
• 2分子の相補鎖のhybridizationの速度: 0.1 – 連続する相補鎖は一度に結合。 – Denaturationはなしとする。
• 1分子内のbranch migrationの速度: 0.01 • 反応時間
– 入力以外のストランドを混合してから100単位時間 – Input1を投入してから100単位時間 – Input2を投入してから100単位時間
課題(オプション)
• 連続的シミュレーション – 各ストランドの初期濃度: 10.0単位濃度 – 刻み幅: 0.01くらいに設定。
• 確率的シミュレーション – 各ストランドは10個ずつ用意。 – 速度は単位時間あたりの反応確率を与える。
• 各分子(構造)の濃度・個数をプロット。 • 両者を比較すると面白い。
b
c a
A C
T1
T2
t2 B A t1 Input 2 Input 1
DNA Automaton
B C
B C
b
c a
A C
T1
T2
t2 B A t1 Input 2 Input 1
DNA Automaton
B C
b c a
A C
T1
T2
t2 B A t1 Input 2 Input 1
DNA Automaton
B C
b
c a
A C
T1
T2
t2 B A t1 Input 2 Input 1
DNA Automaton
B C
b c a
A C
T1
T2
t2 B A t1 Input 2 Input 1
DNA Automaton
B C
b
c a
A C
T1
T2
t2 B Input 2
DNA Automaton
A t1
B C
b
c a
A C
T1
T2
t2 B Input 2
DNA Automaton
A t1
B C
b c a
A C
T1
T2 A t1
DNA Automaton
t2 B Input 2
B C
b c a
A C
T1
T2 A t1
DNA Automaton
t2 B Input 2
B C
b
c a
A C
T1
T2
t2 B
A t1 Input 1
DNA Automaton
B C
b
c a
A C
T1
T2
t2 B
A t1 Input 1
DNA Automaton
B C
b c a
A C
T1
A t1 Input 1
DNA Automaton
T2
t2 B
B C
b c a
A C
T1
A t1 Input 1
DNA Automaton
T2
t2 B
B C
b
c a
A C
T1
T2
DNA Automaton
A t1
t2 B
B C
b
c a
A C
T1
T2
DNA Automaton
A t1
t2 B
B C
b
c a
A C
T1
T2
DNA Automaton
A t1
t2 B
B C
b
c a
A C
T1
T2
DNA Automaton
A t1
t2 B
B C
b c a
A C
T1
A t1
DNA Automaton
T2
t2 B
B C
b c a
A C
T1
A t1
DNA Automaton
T2
t2 B
B C
b c a
A C
T1
A t1
DNA Automaton
T2
t2 B
B C
b c a
A C
T1
A t1
DNA Automaton
T2
t2 B
今年の課題にしたい
• 連続的シミュレーション – 各ストランドの初期濃度: 10.0単位濃度 – 刻み幅: 0.01くらいに設定。
• 確率的シミュレーション – 各ストランドは10個ずつ用意。 – 速度は単位時間あたりの反応確率を与える。
• 各分子(構造)の濃度・個数をプロット。 • 両者を比較すると面白い。
反応のパラメータ
• 2分子の相補鎖のhybridizationの速度: 0.1 – 連続する相補鎖は一度に結合。 – Denaturationはなしとする。
• 1分子内のbranch migrationの速度: 0.01 • 反応時間
– 入力以外のストランドを混合してから100単位時間 – Input1を投入してから100単位時間 – Input2を投入してから100単位時間
DNA反応の速度
反応速度の推定
• Hybridization – 実測値
• およそ一定とみなす
• Denaturation – 二本鎖の自由エネルギーとhybridizationの速度から逆算する
• Branch migration – 実測値
• 配列(特に長さ)に依存
RTG
D
H ekkK
∆−
==
DNA(RNA)の二次構造 • ベースペア i.j の集合 • k-ループ --- k 個のベースペアで囲まれたループ
– 1-ループ • ヘアピン(hairpin)
– 2-ループ • スタック(stack) • バルジ(bulge) • 内部(interior)
– マルチ・ループ(multi-loop) • ループに対してエネルギーが割り当てられる。
ヘアピン スタック バルジ 内部
3-ループ
これらの構造にエネルギーを割り当てる。 (nearest neighborモデル)
a. ヘアピン b. 内部 c. バルジ d. マルチ e. スタック f. シュードノット
DNA二本鎖のエネルギーモデル
・ ・ ・ ・ ・ ・
・ ・ ・ ・ ・ ・
Base pair が交差する場合は考慮しない ( = 一本鎖における Pseudoknot free)
全体の ΔG を部分的な構造の ΔG の総和として計算する
5‘-
3‘-
- 3‘
- 5‘
インターナルループ [Zuker 03]
フリーエンド [Zuker 03]
使用するパラメータ
スタッキングペア [Tanaka 04]
バルジループ
一塩基バルジループ [Tanaka 04]
その他のバルジ [Zuker 03]
Nearest-Neighbor model (NN model)
π計算と確率π計算
並列・並行・分散 • 並列計算
– たくさんのプロセスがそれぞれのコンピュータ(CPU)の上で同時に計算する
• 並行計算 – 複数のプロセスが通信し合いながら、ひとまとまりの計算を行う
– 必ずしも並列計算を必要としない
×平行計算 • 分散計算
– たくさんのプロセスが物理的に分散して計算する
プロセス計算の蘊蓄
• プロセス計算の原点は化学抽象機械にある – 化学反応に触発された抽象的な計算体系 – 並列・並行・分散計算のモデル
• 以後、様々なプロセス計算が発展 – パイ計算・応用パイ計算・アンビエント計算・・・ – ネットワークプロトコルやウェブサービス – プロセス計算に基づくプログラミング言語
• 最近では生体内の化学反応にも応用 – 確率π計算・κ計算
Chemical Abstract Machine
π計算
• 並行計算のモデル • チャネルを通して通信し合うプロセス
– 各種の反応を表現することが可能 • 入れ子の構造
– 膜のモデル • プロセス間の等価性の理論が発展 • 非決定性に確率を付与 ⇒ 確率π計算
プロセスの定義
Gene(a,b) := τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b) Protein(b) := b.Protein(b) + τ.0
チョイス
並列合成
自発的遷移
チャネルaからの入力
チャネルbへの出力
自発的遷移
...|(… + τ.P + …)|... → ...|P|... ...|(τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b))|... → ...|Gene(a,b)|Protein(b)|… ...|(b.Protein(b) + τ.0)|... → ...|0|... ≡ ...|...
通信
...|(… + a.P + …)|(… + a.Q + …)|... → ...|P|Q|... • より一般的には ...|(… + a(x).P(x) + …)|(… + a(M).Q + …)|... → ...|P(M)|Q|...
通信
...|(… + a.P + …)|(… + a.Q + …)|... → ...|P|Q|... ...|(τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b)) |(a.Protein(a) + τ.0)|... → ...|τ.Gene(a,b)|Protein(a)|...
例
Gene(a,b)|Protein(a) ≡ (τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b))|(a.Protein(a) + τ.0) → τ.Gene(a,b)|Protein(a) → Gene(a,b)|Protein(a) ≡ (τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b))|(a.Protein(a) + τ.0) → (τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b))|0 ≡ (τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b)) → Gene(a,b)|Protein(b) ≡ (τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b))|(b.Protein(b) + τ.0) → Gene(a,b)|Protein(b)|(b.Protein(b) + τ.0)
確率π計算
Gene(a,b) := τt.(Gene(a,b)|Protein(b)) + a.τu.Gene(a,b) Protein(b) := b.Protein(b) + τd.0
チョイス
並列合成
自発的遷移
チャネルaからの入力
チャネルbへの出力
ρ(b)
チャネルbの速度
遅延 遅延
遅延
プロセスの例
• トグル・スイッチ Gene(a,b)|Gene(b,a)
• オシレータ Gene(a,b)|Gene(b,c)|Gene(c,a)
ρ(a) = ρ(b) = ρ(c) = 1.0 t = 0.1 d = 0.001 u = 0.0001
細胞のシミュレーション
細胞内における化学反応
• 転写 – 遺伝子 mRNA
• 翻訳 – mRNA タンパク – 制御タンパクは遺伝子の発現を制御
• 代謝 • シグナル伝達 • …
例:遺伝子回路によるトグル・スイッチ
u: λCI の濃度 v: LacR の濃度
• Tian et al., 2006
Hill係数
u: λCI の濃度 v: LacR の濃度
LacR の生成速度
λCI に依存 しない部分
λCI に依存する部分: λCI は三つまとまって LacR の転写を阻害して いると推測される。 3 は Hill係数という。
Hill係数
u: λCI の濃度 v: LacR の濃度
マイトマイシンに 依存しない部分
マイトマイシンCに 依存する部分: Hill係数は 1
λCI の分解速度
微分方程式を数値的に解くと…
パラメータ s の違い --- マイトマイシンCの濃度の違い
少分子系として…
• τ跳躍法の適用 – λCI と LacR の生成と分解の回数は Poisson分布に従う
Poisson分布の平均
propensityと解釈
確率的シミュレーション(τ跳躍法)
レポート課題
b c d
D C
初期構造
a
最初からくっ付いていると仮定している
B C
b c d
D C
入力
a
A D
Input 1 Input 2
課題 • 確率的シミュレーション
– 初期構造を10個用意。 – Input1とInput2 を10個ずつ同時に投入。 – 100単位時間の確率的シミュレーションを行う。
• 各分子(構造)の個数をプロットせよ。 • 反応のパラメータ
– 2分子の相補鎖のhybridizationの速度: 0.1 • Denaturationはなしとする。
– 1分子内のbranch migrationの速度: 0.01 – 速度は単位時間あたりの反応確率を与える。
反応のパラメータ
• 2分子の相補鎖のhybridizationの速度: 0.1 – Denaturationはなしとする。
• 1分子内のbranch migrationの速度: 0.01 • 速度は単位時間あたりの反応確率を与える。
B C
b c d
D C
構造例
a
A D
b c
d
D C
構造例
a
A D
b c
d
D C
構造例
a
A D B C
もう一つの課題
• 以上の反応系を、確率π計算を使ってモデル化せよ。
• 確率π計算のプロセスの定義を与える。 • プロセスの遷移が反応に対応していることを説明する。
〆切
• 7月末 • 情報科学科のレポート提出ボックスに