20160324自由集会講演

206
NGS データからの 超大規模群集行列データの作成 W31-2 田辺晶史 ( 水産総合研究センター・中央水産研究所 )

Transcript of 20160324自由集会講演

Page 1: 20160324自由集会講演

NGS データからの超大規模群集行列データの作成

W31-2

田辺晶史 ( 水産総合研究センター・中央水産研究所 )

Page 2: 20160324自由集会講演

集会 Web ページメタバーコーディング・環境 DNAバーコーディング解析の技法 検索

Page 3: 20160324自由集会講演

参考テキスト生態学のためのメタバーコーディングと DNAバーコーディング 検索

Page 4: 20160324自由集会講演

データ解析の流れ

Page 5: 20160324自由集会講演

NGSdata

Page 6: 20160324自由集会講演

DemultiplexingNGSdata Sample 1

Sample 2

Page 7: 20160324自由集会講演

Denoising/Chimera removalNGSdata Sample 1

Sample 2

Sample 1

Sample 2

Page 8: 20160324自由集会講演

ClusteringNGSdata Sample 1

Sample 2

Sample 1

Sample 2

OTUs

Page 9: 20160324自由集会講演

Community matrix construction

OTU A OTU B OTU C

Sample 1 2 3 0

Sample 2 1 1 3

NGSdata Sample 1

Sample 2

Sample 1

Sample 2

OTUs

Page 10: 20160324自由集会講演

Taxonomic assignment

OTU A OTU B OTU C

Sample 1 2 3 0

Sample 2 1 1 3

family genus species

OTU A Foo Hoge Hoge fuga

OTU B Foo Piyo Piyo piyo

OTU C Bar Baz Baz qux

NGSdata Sample 1

Sample 2

Sample 1

Sample 2

OTUs

Page 11: 20160324自由集会講演
Page 12: 20160324自由集会講演

Sequence extraction

Page 13: 20160324自由集会講演

Sequence extraction

● シーケンサの生データから汎用配列データファイルを作成する

Page 14: 20160324自由集会講演

Sequence extraction

● シーケンサの生データから汎用配列データファイルを作成する● 454/Ionの場合

Page 15: 20160324自由集会講演

Sequence extraction

● シーケンサの生データから汎用配列データファイルを作成する● 454/Ionの場合

● SFFから sfffileや sff_extract -cで FASTQを作成

Page 16: 20160324自由集会講演

Sequence extraction

● シーケンサの生データから汎用配列データファイルを作成する● 454/Ionの場合

● SFFから sfffileや sff_extract -cで FASTQを作成● サンプル識別用タグ配列からデータが始まるようにする

Page 17: 20160324自由集会講演

Sequence extraction

● シーケンサの生データから汎用配列データファイルを作成する● 454/Ionの場合

● SFFから sfffileや sff_extract -cで FASTQを作成● サンプル識別用タグ配列からデータが始まるようにする

● Illuminaの場合

Page 18: 20160324自由集会講演

Sequence extraction

● シーケンサの生データから汎用配列データファイルを作成する● 454/Ionの場合

● SFFから sfffileや sff_extract -cで FASTQを作成● サンプル識別用タグ配列からデータが始まるようにする

● Illuminaの場合● BCLから BCL2FASTQで FASTQを作成

Page 19: 20160324自由集会講演

Sequence extraction

● シーケンサの生データから汎用配列データファイルを作成する● 454/Ionの場合

● SFFから sfffileや sff_extract -cで FASTQを作成● サンプル識別用タグ配列からデータが始まるようにする

● Illuminaの場合● BCLから BCL2FASTQで FASTQを作成● サンプル識別用タグ配列とプライマーから始まるデータ配列は別のファイルにする

Page 20: 20160324自由集会講演

Sequence extraction

● シーケンサの生データから汎用配列データファイルを作成する● 454/Ionの場合

● SFFから sfffileや sff_extract -cで FASTQを作成● サンプル識別用タグ配列からデータが始まるようにする

● Illuminaの場合● BCLから BCL2FASTQで FASTQを作成● サンプル識別用タグ配列とプライマーから始まるデータ配列は別のファイルにする● demultiplex済のデータを渡される場合はプライマーも除去しておいてもらうこと

Page 21: 20160324自由集会講演

Importing FASTQ to Claident pipeline

Page 22: 20160324自由集会講演

Importing FASTQ to Claident pipeline

● FASTQ形式のデータであれば、少し加工すれば取り込むことが可能

Page 23: 20160324自由集会講演

Importing FASTQ to Claident pipeline

● FASTQ形式のデータであれば、少し加工すれば取り込むことが可能● DRAの公開データや demultiplex済で渡された Illuminaの配列データを取り込める

Page 24: 20160324自由集会講演

Importing FASTQ to Claident pipeline

● FASTQ形式のデータであれば、少し加工すれば取り込むことが可能● DRAの公開データや demultiplex済で渡された Illuminaの配列データを取り込める

● ファイル名は下記の形式にする

Page 25: 20160324自由集会講演

Importing FASTQ to Claident pipeline

● FASTQ形式のデータであれば、少し加工すれば取り込むことが可能● DRAの公開データや demultiplex済で渡された Illuminaの配列データを取り込める

● ファイル名は下記の形式にする● RunID__TagID__PrimerID.fastq

Page 26: 20160324自由集会講演

Importing FASTQ to Claident pipeline

● FASTQ形式のデータであれば、少し加工すれば取り込むことが可能● DRAの公開データや demultiplex済で渡された Illuminaの配列データを取り込める

● ファイル名は下記の形式にする● RunID__TagID__PrimerID.fastq● TagIDや PrimerIDがない・わからない場合はダミーを使う

Page 27: 20160324自由集会講演

Importing FASTQ to Claident pipeline

● FASTQ形式のデータであれば、少し加工すれば取り込むことが可能● DRAの公開データや demultiplex済で渡された Illuminaの配列データを取り込める

● ファイル名は下記の形式にする● RunID__TagID__PrimerID.fastq● TagIDや PrimerIDがない・わからない場合はダミーを使う

● FASTQの配列 ID行を下記の形状に加工すればよい

Page 28: 20160324自由集会講演

Importing FASTQ to Claident pipeline

● FASTQ形式のデータであれば、少し加工すれば取り込むことが可能● DRAの公開データや demultiplex済で渡された Illuminaの配列データを取り込める

● ファイル名は下記の形式にする● RunID__TagID__PrimerID.fastq● TagIDや PrimerIDがない・わからない場合はダミーを使う

● FASTQの配列 ID行を下記の形状に加工すればよい● @UniqueID__RunID__TagID__PrimerID

Page 29: 20160324自由集会講演

Importing FASTQ to Claident pipeline

● FASTQ形式のデータであれば、少し加工すれば取り込むことが可能● DRAの公開データや demultiplex済で渡された Illuminaの配列データを取り込める

● ファイル名は下記の形式にする● RunID__TagID__PrimerID.fastq● TagIDや PrimerIDがない・わからない場合はダミーを使う

● FASTQの配列 ID行を下記の形状に加工すればよい● @UniqueID__RunID__TagID__PrimerID● TagIDや PrimerIDがない・わからない場合はダミーを使う

Page 30: 20160324自由集会講演

Importing FASTQ to Claident pipeline

● FASTQ形式のデータであれば、少し加工すれば取り込むことが可能● DRAの公開データや demultiplex済で渡された Illuminaの配列データを取り込める

● ファイル名は下記の形式にする● RunID__TagID__PrimerID.fastq● TagIDや PrimerIDがない・わからない場合はダミーを使う

● FASTQの配列 ID行を下記の形状に加工すればよい● @UniqueID__RunID__TagID__PrimerID● TagIDや PrimerIDがない・わからない場合はダミーを使う

● これらの操作を補助する climportfastqを準備中

Page 31: 20160324自由集会講演
Page 32: 20160324自由集会講演

Demultiplexing - clsplitseq

OTU A OTU B OTU C

Sample 1 2 3 0

Sample 2 1 1 3

family genus species

OTU A Foo Hoge Hoge fuga

OTU B Foo Piyo Piyo piyo

OTU C Bar Baz Baz qux

NGSdata Sample 1

Sample 2

Sample 1

Sample 2

OTUs

Page 33: 20160324自由集会講演

Demultiplexing - clsplitseq

● タグ配列やプライマー配列に基いて由来サンプルを識別して別ファイルへ分離する

Page 34: 20160324自由集会講演

Demultiplexing - clsplitseq

● タグ配列やプライマー配列に基いて由来サンプルを識別して別ファイルへ分離する● FASTA形式のタグ配列リストとプライマー配列リストが必要

Page 35: 20160324自由集会講演

Demultiplexing - clsplitseq

● タグ配列やプライマー配列に基いて由来サンプルを識別して別ファイルへ分離する● FASTA形式のタグ配列リストとプライマー配列リストが必要● single-end、 paired-end、 single index、 dual indexによって 1~ 4の FASTQ形式配列ファイルを与える

Page 36: 20160324自由集会講演

Demultiplexing - clsplitseq

● タグ配列やプライマー配列に基いて由来サンプルを識別して別ファイルへ分離する● FASTA形式のタグ配列リストとプライマー配列リストが必要● single-end、 paired-end、 single index、 dual indexによって 1~ 4の FASTQ形式配列ファイルを与える● ここで得られる demultiplex済 primer除去済ファイルを

DDBJ Sequence Read Archive (DRA)に登録する

Page 37: 20160324自由集会講演
Page 38: 20160324自由集会講演

Concatenating overlapped paired-end

Page 39: 20160324自由集会講演

Concatenating overlapped paired-end

● Paired-endシーケンスデータで両側配列にオーバーラップがある場合は連結する

Page 40: 20160324自由集会講演

Concatenating overlapped paired-end

● Paired-endシーケンスデータで両側配列にオーバーラップがある場合は連結する● pearまたは vsearch --fastq_mergepairsで連結可能

Page 41: 20160324自由集会講演

Concatenating overlapped paired-end

● Paired-endシーケンスデータで両側配列にオーバーラップがある場合は連結する● pearまたは vsearch --fastq_mergepairsで連結可能● 連結対象データファイルが 2組以上ある場合は forなどで連続処理

Page 42: 20160324自由集会講演

Concatenating nonoverlapped paired-end

Page 43: 20160324自由集会講演

Concatenating nonoverlapped paired-end

● 後述の quality-trimming/filtering後に下記のように連結

Page 44: 20160324自由集会講演

Concatenating nonoverlapped paired-end

● 後述の quality-trimming/filtering後に下記のように連結● <- reverse read - padding - forward read ->

Page 45: 20160324自由集会講演

Concatenating nonoverlapped paired-end

● 後述の quality-trimming/filtering後に下記のように連結● <- reverse read - padding - forward read ->

● paddingのため identity過大になるので、 clustering時は offsetを指定

Page 46: 20160324自由集会講演

Concatenating nonoverlapped paired-end

● 後述の quality-trimming/filtering後に下記のように連結● <- reverse read - padding - forward read ->

● paddingのため identity過大になるので、 clustering時は offsetを指定● clustering後に padding配列に基づいて分離

Page 47: 20160324自由集会講演

Concatenating nonoverlapped paired-end

● 後述の quality-trimming/filtering後に下記のように連結● <- reverse read - padding - forward read ->

● paddingのため identity過大になるので、 clustering時は offsetを指定● clustering後に padding配列に基づいて分離● 分離したそれぞれで taxonomic assignmentして結果を merge

Page 48: 20160324自由集会講演

Quality-trimming - clfilterseq

Page 49: 20160324自由集会講演

Quality-trimming - clfilterseq

● 配列の末端の QVの低い部分を削る

Page 50: 20160324自由集会講演

Quality-trimming - clfilterseq

● 配列の末端の QVの低い部分を削る● 閾値は 454の場合 27がよいとされている (Kunin et al. 2010)

Page 51: 20160324自由集会講演

Quality-trimming - clfilterseq

● 配列の末端の QVの低い部分を削る● 閾値は 454の場合 27がよいとされている (Kunin et al. 2010)● Ionの場合はデータを残すには 20くらいまで下げざるを得ない

Page 52: 20160324自由集会講演

Quality-trimming - clfilterseq

● 配列の末端の QVの低い部分を削る● 閾値は 454の場合 27がよいとされている (Kunin et al. 2010)● Ionの場合はデータを残すには 20くらいまで下げざるを得ない● Illuminaの場合は 30を使うことが多いが連結配列は不要

Page 53: 20160324自由集会講演

Quality-trimming - clfilterseq

● 配列の末端の QVの低い部分を削る● 閾値は 454の場合 27がよいとされている (Kunin et al. 2010)● Ionの場合はデータを残すには 20くらいまで下げざるを得ない● Illuminaの場合は 30を使うことが多いが連結配列は不要

● PRINSEQ、 Trimmomaticといった定番を使用してもよい

Page 54: 20160324自由集会講演

Quality-filtering - clfilterseq

Page 55: 20160324自由集会講演

Quality-filtering - clfilterseq

● 長さや QVに基いて配列を除去する

Page 56: 20160324自由集会講演

Quality-filtering - clfilterseq

● 長さや QVに基いて配列を除去する● vsearch --fastq_filterを用いることで、 QVから予想される配列中の期待読み間違い数・率に基づく処理も可能

Page 57: 20160324自由集会講演
Page 58: 20160324自由集会講演

Denoising/Chimera removal - clcleanseqv

OTU A OTU B OTU C

Sample 1 2 3 0

Sample 2 1 1 3

family genus species

OTU A Foo Hoge Hoge fuga

OTU B Foo Piyo Piyo piyo

OTU C Bar Baz Baz qux

NGSdata Sample 1

Sample 2

Sample 1

Sample 2

OTUs

Page 59: 20160324自由集会講演

Denoising/Chimera removal - clcleanseqv

● 読み間違いゼロの塩基配列がある程度存在すると仮定

Page 60: 20160324自由集会講演

Denoising/Chimera removal - clcleanseqv

● 読み間違いゼロの塩基配列がある程度存在すると仮定● 読み間違いは無作為に入ると仮定

Page 61: 20160324自由集会講演

Denoising/Chimera removal - clcleanseqv

● 読み間違いゼロの塩基配列がある程度存在すると仮定● 読み間違いは無作為に入ると仮定● 完全一致でまとめたとき、真の配列クラスタは配列が多いはず

Page 62: 20160324自由集会講演

Denoising/Chimera removal - clcleanseqv

● 読み間違いゼロの塩基配列がある程度存在すると仮定● 読み間違いは無作為に入ると仮定● 完全一致でまとめたとき、真の配列クラスタは配列が多いはず● 配列 n本未満のクラスタに属する配列を除去する

Page 63: 20160324自由集会講演

Denoising/Chimera removal - clcleanseqv

● 読み間違いゼロの塩基配列がある程度存在すると仮定● 読み間違いは無作為に入ると仮定● 完全一致でまとめたとき、真の配列クラスタは配列が多いはず● 配列 n本未満のクラスタに属する配列を除去する● 仮定を満たすシーケンサなら、どの機種にも適用可能

Page 64: 20160324自由集会講演

Denoising/Chimera removal - clcleanseqv

● 読み間違いゼロの塩基配列がある程度存在すると仮定● 読み間違いは無作為に入ると仮定● 完全一致でまとめたとき、真の配列クラスタは配列が多いはず● 配列 n本未満のクラスタに属する配列を除去する● 仮定を満たすシーケンサなら、どの機種にも適用可能● PCRでのコピーミスも検出可能

Page 65: 20160324自由集会講演

Denoising/Chimera removal - clcleanseqv

● 読み間違いゼロの塩基配列がある程度存在すると仮定● 読み間違いは無作為に入ると仮定● 完全一致でまとめたとき、真の配列クラスタは配列が多いはず● 配列 n本未満のクラスタに属する配列を除去する● 仮定を満たすシーケンサなら、どの機種にも適用可能● PCRでのコピーミスも検出可能● ただし、データが減少する、適切な nの値が不明

Page 66: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法

Page 67: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法

真の配列 非シングルトンの配列

配列空間

Page 68: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法1. 完全一致配列をまとめて (赤~青の点 )、シングルトン除去

配列空間

配列多 配列少

Page 69: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法1. 完全一致配列をまとめて (赤~青の点 )、シングルトン除去2. さらに 2塩基不一致許容で配列をまとめる (灰色の円 )

配列空間

配列多 配列少

Page 70: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法1. 完全一致配列をまとめて (赤~青の点 )、シングルトン除去2. さらに 2塩基不一致許容で配列をまとめる (灰色の円 )

3. 灰色の中で配列数 2位以下のクラスタ (白縁の点 )の配列数分布の中央値を採用

配列空間

配列多 配列少

Page 71: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法1. 完全一致配列をまとめて (赤~青の点 )、シングルトン除去2. さらに 2塩基不一致許容で配列をまとめる (灰色の円 )

3. 灰色の中で配列数 2位以下のクラスタ (白縁の点 )の配列数分布の中央値を採用

配列空間

配列多 配列少

Page 72: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法

配列空間

配列多 配列少

Page 73: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法● 灰色内で配列数最大のクラスタ (黒縁の点 )は真の配列である可能性が高い

配列空間

配列多 配列少

Page 74: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法● 灰色内で配列数 2位以下のクラスタ (白縁の点 )は「読み間違いはあるが、その数は 2塩基以下」の配列である可能性が高い

配列空間

配列多 配列少

Page 75: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法● 読み間違いの多いクラスタほど配列が少ないと仮定できる

配列空間

配列多 配列少

Page 76: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法● 読み間違いの多いクラスタほど配列が少ないと仮定できる● 「 3塩基以上の読み間違いがある」クラスタ (縁なしの点 )は「読み間違いはあるが 2塩基以下」のクラスタ (白縁の点 )よりも配列が少ないはず

配列空間

配列多 配列少

Page 77: 20160324自由集会講演

Li et al. (2012) による最適な n の決定方法

配列多 配列少

● 読み間違いの多いクラスタほど配列が少ないと仮定できる● 「 3塩基以上の読み間違いがある」クラスタ (縁なしの点 )の多くは「読み間違いはあるが 2塩基以下」のクラスタ (白縁の点 )の配列数分布の中央値より小さい可能性が高い

配列空間

Page 78: 20160324自由集会講演

Li et al. (2012) と clcleanseqv の違い

Page 79: 20160324自由集会講演

Li et al. (2012) と clcleanseqv の違い

● CD-HITの代わりに VSEARCHを使用

Page 80: 20160324自由集会講演

Li et al. (2012) と clcleanseqv の違い

● CD-HITの代わりに VSEARCHを使用● セカンダリクラスタリングは「 1塩基不一致許容」がデフォルト設定

Page 81: 20160324自由集会講演

Li et al. (2012) と clcleanseqv の違い

● CD-HITの代わりに VSEARCHを使用● セカンダリクラスタリングは「 1塩基不一致許容」がデフォルト設定● プライマリ、セカンダリ両クラスタリングの不一致許容量は変更可能

Page 82: 20160324自由集会講演

Li et al. (2012) と clcleanseqv の違い

● CD-HITの代わりに VSEARCHを使用● セカンダリクラスタリングは「 1塩基不一致許容」がデフォルト設定● プライマリ、セカンダリ両クラスタリングの不一致許容量は変更可能● nの値として採用するクラスタサイズの分位点も変更可能

Page 83: 20160324自由集会講演

Li et al. (2012) と clcleanseqv の違い

● CD-HITの代わりに VSEARCHを使用● セカンダリクラスタリングは「 1塩基不一致許容」がデフォルト設定● プライマリ、セカンダリ両クラスタリングの不一致許容量は変更可能● nの値として採用するクラスタサイズの分位点も変更可能● 読み間違いが多い場合は以下のように変更すると良い

Page 84: 20160324自由集会講演

Li et al. (2012) と clcleanseqv の違い

● CD-HITの代わりに VSEARCHを使用● セカンダリクラスタリングは「 1塩基不一致許容」がデフォルト設定● プライマリ、セカンダリ両クラスタリングの不一致許容量は変更可能● nの値として採用するクラスタサイズの分位点も変更可能● 読み間違いが多い場合は以下のように変更すると良い

● プライマリクラスタリングでは 1塩基不一致許容

Page 85: 20160324自由集会講演

Li et al. (2012) と clcleanseqv の違い

● CD-HITの代わりに VSEARCHを使用● セカンダリクラスタリングは「 1塩基不一致許容」がデフォルト設定● プライマリ、セカンダリ両クラスタリングの不一致許容量は変更可能● nの値として採用するクラスタサイズの分位点も変更可能● 読み間違いが多い場合は以下のように変更すると良い

● プライマリクラスタリングでは 1塩基不一致許容● セカンダリクラスタリングでは 3塩基不一致許容

Page 86: 20160324自由集会講演

Estimating expected error by VSEARCH

Page 87: 20160324自由集会講演

Estimating expected error by VSEARCH

● VSEARCHで QVに基いて期待読み間違い数を推定可能

Page 88: 20160324自由集会講演

Estimating expected error by VSEARCH

● VSEARCHで QVに基いて期待読み間違い数を推定可能● vsearch --fastq_eestats FILENAME --output FILENAME

Page 89: 20160324自由集会講演

Estimating expected error by VSEARCH

● VSEARCHで QVに基いて期待読み間違い数を推定可能● vsearch --fastq_eestats FILENAME --output FILENAME

● この推定結果に基いて denoisingのプライマリクラスタリング、セカンダリクラスタリングの不一致許容量を決定する

Page 90: 20160324自由集会講演

Denoising/Chimera removal by PCR replication

Page 91: 20160324自由集会講演

Denoising/Chimera removal by PCR replication

採集

Page 92: 20160324自由集会講演

Denoising/Chimera removal by PCR replication

採集 DNA抽出

Page 93: 20160324自由集会講演

Denoising/Chimera removal by PCR replication

採集 DNA抽出

PCR PCR

Page 94: 20160324自由集会講演

Denoising/Chimera removal by PCR replication

採集 DNA抽出

サンプル識別用タグ配列付加PCR PCR

サンプル識別用タグ配列付加

Page 95: 20160324自由集会講演

Denoising/Chimera removal by PCR replication

採集 DNA抽出

サンプル識別用タグ配列付加

混合

PCR PCR

サンプル識別用タグ配列付加

Page 96: 20160324自由集会講演

Denoising/Chimera removal by PCR replication

採集 DNA抽出

サンプル識別用タグ配列付加

混合シーケンス

PCR PCR

サンプル識別用タグ配列付加

Page 97: 20160324自由集会講演

Denoising/Chimera removal by PCR replication

採集

完全一致配列をまとめる

DNA抽出

サンプル識別用タグ配列付加

混合シーケンス

PCR PCR

サンプル識別用タグ配列付加

Page 98: 20160324自由集会講演

Denoising/Chimera removal by PCR replication

採集

完全一致配列をまとめる

レプリケート間共通配列のみ抽出

DNA抽出

サンプル識別用タグ配列付加

混合シーケンス

PCR PCR

サンプル識別用タグ配列付加

Page 99: 20160324自由集会講演
Page 100: 20160324自由集会講演

Clustering by using VSEARCH - clclassseqv

OTU A OTU B OTU C

Sample 1 2 3 0

Sample 2 1 1 3

family genus species

OTU A Foo Hoge Hoge fuga

OTU B Foo Piyo Piyo piyo

OTU C Bar Baz Baz qux

NGSdata Sample 1

Sample 2

Sample 1

Sample 2

OTUs

Page 101: 20160324自由集会講演

Clustering by using VSEARCH - clclassseqv

● 残っている配列を VSEARCHに渡してクラスタリング

Page 102: 20160324自由集会講演

Clustering by using VSEARCH - clclassseqv

● 残っている配列を VSEARCHに渡してクラスタリング1. 完全一致配列をクラスタリングしてコピー数をカウント

Page 103: 20160324自由集会講演

Clustering by using VSEARCH - clclassseqv

配列多 配列少

● 残っている配列を VSEARCHに渡してクラスタリング1. 完全一致配列をクラスタリングしてコピー数をカウント

Page 104: 20160324自由集会講演

Clustering by using VSEARCH - clclassseqv

配列多 配列少

● 残っている配列を VSEARCHに渡してクラスタリング1. 完全一致配列をクラスタリングしてコピー数をカウント2. コピー数の多い配列から順によりコピー数の多い配列と比較3. 類似度が閾値を上回ればまとめる

Page 105: 20160324自由集会講演

Clustering by using VSEARCH - clclassseqv

配列多 配列少

● 残っている配列を VSEARCHに渡してクラスタリング1. 完全一致配列をクラスタリングしてコピー数をカウント2. コピー数の多い配列から順によりコピー数の多い配列と比較3. 類似度が閾値を上回ればまとめる

Page 106: 20160324自由集会講演

Recovering excluded sequences - clrecoverseqv

Page 107: 20160324自由集会講演

Recovering excluded sequences - clrecoverseqv

● quality-filteringや denoisingで除去された配列でも、クラスタ内に入るなら復活させてやる

Page 108: 20160324自由集会講演

Recovering excluded sequences - clrecoverseqv

● quality-filteringや denoisingで除去された配列でも、クラスタ内に入るなら復活させてやる● 本当にやった方がいいかどうかは不明

Page 109: 20160324自由集会講演
Page 110: 20160324自由集会講演

De novo chimera removal - clrunuchime

データ中の親配列 1データ中の親配列 2データ中のキメラ配列 1

Page 111: 20160324自由集会講演

De novo chimera removal - clrunuchime

データ中の親配列 1データ中の親配列 2データ中のキメラ配列 1

キメラは PCR 中に生成されるので、PCR 前からある親配列よりコピー数が小さいはず

Page 112: 20160324自由集会講演

De novo chimera removal - clrunuchime

データ中の親配列 1データ中の親配列 2データ中のキメラ配列 1

キメラ配列の親配列のリード数キメラ配列のうちの 1 種類のリード数

Page 113: 20160324自由集会講演

De novo chimera removal - clrunuchime

データ中の親配列 1データ中の親配列 2データ中のキメラ配列 1

キメラ配列の親配列のリード数キメラ配列のうちの 1 種類のリード数

>上の条件を満たす配列をキメラとみなして除去

(Edgar et al. 2011)

Page 114: 20160324自由集会講演

Chimera removal using reference - clrunuchime

Page 115: 20160324自由集会講演

Chimera removal using reference - clrunuchime

データをクエリにして参照配列データベースを検索

Page 116: 20160324自由集会講演

Chimera removal using reference - clrunuchime

参照配列 1参照配列 2データ中のキメラ配列 1

データをクエリにして参照配列データベースを検索

Page 117: 20160324自由集会講演

Chimera removal using reference - clrunuchime

上の条件を満たす配列をキメラとみなして除去(Edgar et al. 2011)

参照配列 1参照配列 2データ中のキメラ配列 1

データをクエリにして参照配列データベースを検索

Page 118: 20160324自由集会講演

Reference sequence databases for UCHIME

Page 119: 20160324自由集会講演

Reference sequence databases for UCHIME

● 細菌 16S用参照配列データベースは RDPから入手可能

Page 120: 20160324自由集会講演

Reference sequence databases for UCHIME

● 細菌 16S用参照配列データベースは RDPから入手可能● 真菌 ITS用参照配列データベースは UNITEから入手可能

Page 121: 20160324自由集会講演

Reference sequence databases for UCHIME

● 細菌 16S用参照配列データベースは RDPから入手可能● 真菌 ITS用参照配列データベースは UNITEから入手可能● 動物ミトゲノムや植物葉緑体ゲノム用参照配列データベースを準備中

Page 122: 20160324自由集会講演

Target locus extraction

Page 123: 20160324自由集会講演

Target locus extraction

● ITSxによる ITS1/ITS2の抽出

Page 124: 20160324自由集会講演

Target locus extraction

● ITSxによる ITS1/ITS2の抽出● Metaxaによる LSU/SSU rRNAの抽出

Page 125: 20160324自由集会講演

Target locus extraction

● ITSxによる ITS1/ITS2の抽出● Metaxaによる LSU/SSU rRNAの抽出● cldivseqによる切断

Page 126: 20160324自由集会講演
Page 127: 20160324自由集会講演

Community matrix construction - clsumclass

OTU A OTU B OTU C

Sample 1 2 3 0

Sample 2 1 1 3

family genus species

OTU A Foo Hoge Hoge fuga

OTU B Foo Piyo Piyo piyo

OTU C Bar Baz Baz qux

NGSdata Sample 1

Sample 2

Sample 1

Sample 2

OTUs

Page 128: 20160324自由集会講演

Community matrix construction - clsumclass

● clustered.otu.gzから以下のテーブルを生成する

Page 129: 20160324自由集会講演

Community matrix construction - clsumclass

● clustered.otu.gzから以下のテーブルを生成する

samplename OTU1 OTU2 OTU3 OTU4 OTU5 OTUN

sample1 10 0 101 344 433 674

sample2 883 101002 6 0 3 0

sample3 403 206 98 633 334 122

sample4 5769 22737 9954 5001 1224 184

sampleN 558 0 0 22 105 199

Page 130: 20160324自由集会講演

Community matrix construction - clsumclass

● clustered.otu.gzから以下のテーブルを生成する● クラスタリング後に配列をフィルタリングした場合は clfiltersumで加工

samplename OTU1 OTU2 OTU3 OTU4 OTU5 OTUN

sample1 10 0 101 344 433 674

sample2 883 101002 6 0 3 0

sample3 403 206 98 633 334 122

sample4 5769 22737 9954 5001 1224 184

sampleN 558 0 0 22 105 199

Page 131: 20160324自由集会講演

Community matrix construction - clsumclass

● clustered.otu.gzから以下のテーブルを生成する● クラスタリング後に配列をフィルタリングした場合は clfiltersumで加工

● 配列データに合わせてテーブルをフィルタリングする

samplename OTU1 OTU2 OTU3 OTU4 OTU5 OTUN

sample1 10 0 101 344 433 674

sample2 883 101002 6 0 3 0

sample3 403 206 98 633 334 122

sample4 5769 22737 9954 5001 1224 184

sampleN 558 0 0 22 105 199

Page 132: 20160324自由集会講演
Page 133: 20160324自由集会講演

Taxonomic assignment - clidentseq/classigntax

OTU A OTU B OTU C

Sample 1 2 3 0

Sample 2 1 1 3

family genus species

OTU A Foo Hoge Hoge fuga

OTU B Foo Piyo Piyo piyo

OTU C Bar Baz Baz qux

NGSdata Sample 1

Sample 2

Sample 1

Sample 2

OTUs

Page 134: 20160324自由集会講演

Taxonomic assignment - clidentseq/classigntax

● 参照配列データベースから得た BLAST検索結果に基いて OTUを分子同定

Page 135: 20160324自由集会講演

Taxonomic assignment - clidentseq/classigntax

● 参照配列データベースから得た BLAST検索結果に基いて OTUを分子同定1. 参照配列データベースを対象に BLAST検索して近隣配列群を取得

Page 136: 20160324自由集会講演

Taxonomic assignment - clidentseq/classigntax

● 参照配列データベースから得た BLAST検索結果に基いて OTUを分子同定1. 参照配列データベースを対象に BLAST検索して近隣配列群を取得2. 近隣配列群の分類群情報の厳密合意分類群を採用

Page 137: 20160324自由集会講演

Taxonomic assignment - clidentseq/classigntax

● 参照配列データベースから得た BLAST検索結果に基いて OTUを分子同定1. 参照配列データベースを対象に BLAST検索して近隣配列群を取得2. 近隣配列群の分類群情報の厳密合意分類群を採用

● 厳密合意を任意の閾値の多数決合意に変更可能

Page 138: 20160324自由集会講演

Taxonomic assignment - clidentseq/classigntax

● 参照配列データベースから得た BLAST検索結果に基いて OTUを分子同定1. 参照配列データベースを対象に BLAST検索して近隣配列群を取得2. 近隣配列群の分類群情報の厳密合意分類群を採用

● 厳密合意を任意の閾値の多数決合意に変更可能● 誤同定されている配列がヒットすると下位まで同定できないのを回避

Page 139: 20160324自由集会講演

Criterion proposed in Tanabe and Toju (2013)

Page 140: 20160324自由集会講演

Criterion proposed in Tanabe and Toju (2013)

問い合わせ配列と最近隣配列間の変異量

Page 141: 20160324自由集会講演

Criterion proposed in Tanabe and Toju (2013)

問い合わせ配列と最近隣配列間の変異量

同定結果分類群内の最大変異量<

Page 142: 20160324自由集会講演

Query-centric auto-k-NN (QCauto) method

1. 最近隣配列 (A)を探し出して変異量 (DQA)を算出

問い合わせ配列A

DQA

配列空間

Page 143: 20160324自由集会講演

Query-centric auto-k-NN (QCauto) method

1. 最近隣配列 (A)を探し出して変異量 (DQA)を算出2. DAB>DQAを満たす配列のうち最も Aに近い配列 (B)を得る

A

DQA 問い合わせ配列

配列空間B

Page 144: 20160324自由集会講演

Query-centric auto-k-NN (QCauto) method

1. 最近隣配列 (A)を探し出して変異量 (DQA)を算出2. DAB>DQAを満たす配列のうち最も Aに近い配列 (B)を得る3. DQN≤DQBを満たすすべての配列 (N)を得る4. A, B, Nの全配列で共通する分類群を採用

A

DQB

N

N

N

問い合わせ配列

配列空間B

Page 145: 20160324自由集会講演

Query-centric auto-k-NN (QCauto) method

1. 最近隣配列 (A)を探し出して変異量 (DQA)を算出2. DAB>DQAを満たす配列のうち最も Aに近い配列 (B)を得る3. DQN≤DQBを満たすすべての配列 (N)を得る4. A, B, Nの全配列で共通する分類群を採用

A

DQB

N

N

N

問い合わせ配列

配列空間B

問い合わせ配列と最近隣配列間の変異量DQA

DQB

同定結果分類群内の最大変異量

<≤

Page 146: 20160324自由集会講演

イメージ図

既知配列 B

既知配列 A

問い合わせ配列

配列空間

Page 147: 20160324自由集会講演

イメージ図

既知配列 B

既知配列 A

問い合わせ配列

配列空間

属 genus Ω種 species α

属 genus Ω種 species β

Page 148: 20160324自由集会講演

イメージ図

既知配列 B

既知配列 A

問い合わせ配列属 Ω の変異の範囲

配列空間

属 genus Ω種 species α

属 genus Ω種 species β

Page 149: 20160324自由集会講演

イメージ図

既知配列 B

既知配列 A

問い合わせ配列属 Ω の変異の範囲

配列空間

属 genus Ω種 species α

属 genus Ω種 species β属 genus Ω種 species ?

Page 150: 20160324自由集会講演

Merging multiple assignment results - clmergeassign

Page 151: 20160324自由集会講演

Merging multiple assignment results - clmergeassign

● 複数の既知配列データベースでの同定結果を統合

Page 152: 20160324自由集会講演

Merging multiple assignment results - clmergeassign

● 複数の既知配列データベースでの同定結果を統合● 種以下まで情報がある既知配列のみのデータベースでの同定結果● 科以下まで情報がある既知配列のみのデータベースでの同定結果

Page 153: 20160324自由集会講演

Merging multiple assignment results - clmergeassign

● 複数の既知配列データベースでの同定結果を統合● 種以下まで情報がある既知配列のみのデータベースでの同定結果● 科以下まで情報がある既知配列のみのデータベースでの同定結果

● 厳しい制約下の同定結果と制約を緩めた同定結果を統合

Page 154: 20160324自由集会講演

Merging multiple assignment results - clmergeassign

● 複数の既知配列データベースでの同定結果を統合● 種以下まで情報がある既知配列のみのデータベースでの同定結果● 科以下まで情報がある既知配列のみのデータベースでの同定結果

● 厳しい制約下の同定結果と制約を緩めた同定結果を統合● 類似配列の厳密合意分類群を採用した同定結果● 類似配列の 90%多数決合意分類群を採用した同定結果

Page 155: 20160324自由集会講演

Merging multiple assignment results - clmergeassign

● 複数の既知配列データベースでの同定結果を統合● 種以下まで情報がある既知配列のみのデータベースでの同定結果● 科以下まで情報がある既知配列のみのデータベースでの同定結果

● 厳しい制約下の同定結果と制約を緩めた同定結果を統合● 類似配列の厳密合意分類群を採用した同定結果● 類似配列の 90%多数決合意分類群を採用した同定結果

● 複数の遺伝子座での同定結果を統合

Page 156: 20160324自由集会講演

Merging multiple assignment results - clmergeassign

● 複数の既知配列データベースでの同定結果を統合● 種以下まで情報がある既知配列のみのデータベースでの同定結果● 科以下まで情報がある既知配列のみのデータベースでの同定結果

● 厳しい制約下の同定結果と制約を緩めた同定結果を統合● 類似配列の厳密合意分類群を採用した同定結果● 類似配列の 90%多数決合意分類群を採用した同定結果

● 複数の遺伝子座での同定結果を統合● 遺伝子座 Aの配列での同定結果● 遺伝子座 Bの配列での同定結果

Page 157: 20160324自由集会講演

Merging multiple assignment results - clmergeassign

● 複数の既知配列データベースでの同定結果を統合● 種以下まで情報がある既知配列のみのデータベースでの同定結果● 科以下まで情報がある既知配列のみのデータベースでの同定結果

● 厳しい制約下の同定結果と制約を緩めた同定結果を統合● 類似配列の厳密合意分類群を採用した同定結果● 類似配列の 90%多数決合意分類群を採用した同定結果

● 複数の遺伝子座での同定結果を統合● 遺伝子座 Aの配列での同定結果● 遺伝子座 Bの配列での同定結果

● 優先順位を設定可能

Page 158: 20160324自由集会講演

Merging multiple assignment results - clmergeassign

● 複数の既知配列データベースでの同定結果を統合● 種以下まで情報がある既知配列のみのデータベースでの同定結果● 科以下まで情報がある既知配列のみのデータベースでの同定結果

● 厳しい制約下の同定結果と制約を緩めた同定結果を統合● 類似配列の厳密合意分類群を採用した同定結果● 類似配列の 90%多数決合意分類群を採用した同定結果

● 複数の遺伝子座での同定結果を統合● 遺伝子座 Aの配列での同定結果● 遺伝子座 Bの配列での同定結果

● 優先順位を設定可能● 優先順位は自分で決める必要がある

Page 159: 20160324自由集会講演

優先度 綱 目 科 属 種高 哺乳綱 霊長目 ヒト科低 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

Merging taxonomy with priority

Page 160: 20160324自由集会講演

優先度 綱 目 科 属 種高 哺乳綱 霊長目 ヒト科低 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

Merging taxonomy with priority

綱 目 科 属 種統合結果 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

Page 161: 20160324自由集会講演

優先度 綱 目 科 属 種高 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ低 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

Merging taxonomy with priority

Page 162: 20160324自由集会講演

優先度 綱 目 科 属 種高 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ低 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

Merging taxonomy with priority

綱 目 科 属 種統合結果 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ

Page 163: 20160324自由集会講演

優先度 綱 目 科 属 種高 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ低 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

Merging taxonomy with priority

綱 目 科 属 種統合結果 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ

優先度の低い同定結果は・優先度の高い同定結果より低レベルまで同定できている・優先度の高い同定結果と矛盾がない場合に限り結果を採用される

Page 164: 20160324自由集会講演

優先度 綱 目 科 属 種同 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ同 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

Merging taxonomy with priority

Page 165: 20160324自由集会講演

優先度 綱 目 科 属 種同 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ同 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

Merging taxonomy with priority

綱 目 科 属 種統合結果 哺乳綱 霊長目 ヒト科

Page 166: 20160324自由集会講演

優先度 綱 目 科 属 種同 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ同 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

Merging taxonomy with priority

綱 目 科 属 種統合結果 哺乳綱 霊長目 ヒト科

 優先度が同じ同定結果に矛盾がある場合、厳密合意を採用

Page 167: 20160324自由集会講演

優先度 綱 目 科 属 種同 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ同 哺乳綱 霊長目 ヒト科 ヒト属

Merging taxonomy with priority

Page 168: 20160324自由集会講演

優先度 綱 目 科 属 種同 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ同 哺乳綱 霊長目 ヒト科 ヒト属

Merging taxonomy with priority

綱 目 科 属 種統合結果 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ

Page 169: 20160324自由集会講演

優先度 綱 目 科 属 種同 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ同 哺乳綱 霊長目 ヒト科 ヒト属

Merging taxonomy with priority

綱 目 科 属 種統合結果 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ

優先度が同じ同定結果に矛盾がある場合、 --preferlowerオプションでより低レベルまで同定できている結果を採用

Page 170: 20160324自由集会講演
Page 171: 20160324自由集会講演

Sampling as multiple filtering problem

Page 172: 20160324自由集会講演

Sampling as multiple filtering problem

● 群集生態学では飽和サンプリングできるかどうか、できないなら飽和度の均質化が重要になる

Page 173: 20160324自由集会講演

Sampling as multiple filtering problem

● 群集生態学では飽和サンプリングできるかどうか、できないなら飽和度の均質化が重要になる● 野外観察・採集ではサンプリングは 1 段階

Page 174: 20160324自由集会講演

Sampling as multiple filtering problem

● 群集生態学では飽和サンプリングできるかどうか、できないなら飽和度の均質化が重要になる● 野外観察・採集ではサンプリングは 1 段階● メタバーコーディングでは、多段階になる

Page 175: 20160324自由集会講演

Sampling as multiple filtering problem

● 群集生態学では飽和サンプリングできるかどうか、できないなら飽和度の均質化が重要になる● 野外観察・採集ではサンプリングは 1 段階● メタバーコーディングでは、多段階になる1. 現物のサンプリング2. DNA抽出3. PCR

4. シーケンス (塩基配列のサンプリング )

Page 176: 20160324自由集会講演

Sampling as multiple filtering problem

● 群集生態学では飽和サンプリングできるかどうか、できないなら飽和度の均質化が重要になる● 野外観察・採集ではサンプリングは 1 段階● メタバーコーディングでは、多段階になる1. 現物のサンプリング2. DNA抽出3. PCR

4. シーケンス (塩基配列のサンプリング )● シーケンスを飽和させても、サンプリング量不足・ DNA抽出法が不適切・

PCRバイアス等で実際には飽和サンプリングできていないかもしれない

Page 177: 20160324自由集会講演

Sampling as multiple filtering problem

● 群集生態学では飽和サンプリングできるかどうか、できないなら飽和度の均質化が重要になる● 野外観察・採集ではサンプリングは 1 段階● メタバーコーディングでは、多段階になる1. 現物のサンプリング2. DNA抽出3. PCR

4. シーケンス (塩基配列のサンプリング )● シーケンスを飽和させても、サンプリング量不足・ DNA抽出法が不適切・

PCRバイアス等で実際には飽和サンプリングできていないかもしれない● レプリケートの確保とレプリケートを足したときに OTUが増加するかのチェックが有効

Page 178: 20160324自由集会講演
Page 179: 20160324自由集会講演

相対・絶対 abundance の定量

Page 180: 20160324自由集会講演

相対・絶対 abundance の定量無理

Page 181: 20160324自由集会講演
Page 182: 20160324自由集会講演

必要となる基礎知識

Page 183: 20160324自由集会講演

必要となる基礎知識● UNIXコマンドライン操作

Page 184: 20160324自由集会講演

必要となる基礎知識● UNIXコマンドライン操作

Page 185: 20160324自由集会講演

必要となる基礎知識● UNIXコマンドライン操作

Page 186: 20160324自由集会講演

必要となる基礎知識● UNIXコマンドライン操作● Rによるデータ解析

Page 187: 20160324自由集会講演

必要となる基礎知識● UNIXコマンドライン操作● Rによるデータ解析

Page 188: 20160324自由集会講演

必要となる基礎知識● UNIXコマンドライン操作● Rによるデータ解析

Page 189: 20160324自由集会講演

必要となる基礎知識● UNIXコマンドライン操作● Rによるデータ解析● 各種データフォーマット

Page 190: 20160324自由集会講演

必要となる基礎知識● UNIXコマンドライン操作● Rによるデータ解析● 各種データフォーマット● 場合によっては Perl・ Python・ Ruby 等による簡易プログラミング

Page 191: 20160324自由集会講演

必要となる基礎知識● UNIXコマンドライン操作● Rによるデータ解析● 各種データフォーマット● 場合によっては Perl・ Python・ Ruby 等による簡易プログラミング

Page 192: 20160324自由集会講演

必要となる基礎知識● UNIXコマンドライン操作● Rによるデータ解析● 各種データフォーマット● 場合によっては Perl・ Python・ Ruby 等による簡易プログラミング

Page 193: 20160324自由集会講演
Page 194: 20160324自由集会講演

必要なハードウェアスペック

Page 195: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限

Page 196: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える

Page 197: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える● プラス 2 万程度で OSインストールディスクを SSD 化

Page 198: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える● プラス 2 万程度で OSインストールディスクを SSD 化● プラス 6 万程度でデータディスクを RAID1 化

Page 199: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える● プラス 2 万程度で OSインストールディスクを SSD 化● プラス 6 万程度でデータディスクを RAID1 化● プラス 6 万程度でメモリ 64GB 化

Page 200: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える● プラス 2 万程度で OSインストールディスクを SSD 化● プラス 6 万程度でデータディスクを RAID6 化● プラス 6 万程度でメモリ 64GB 化

Page 201: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える● プラス 2 万程度で OSインストールディスクを SSD 化● プラス 6 万程度でデータディスクを RAID6 化● プラス 6 万程度でメモリ 64GB 化

● CPU 16コア、メモリ 128GB以上あるとだいぶ楽になる

Page 202: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える● プラス 2 万程度で OSインストールディスクを SSD 化● プラス 6 万程度でデータディスクを RAID6 化● プラス 6 万程度でメモリ 64GB 化

● CPU 16コア、メモリ 128GB以上あるとだいぶ楽になる● 100 万コース

Page 203: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える● プラス 2 万程度で OSインストールディスクを SSD 化● プラス 6 万程度でデータディスクを RAID6 化● プラス 6 万程度でメモリ 64GB 化

● CPU 16コア、メモリ 128GB以上あるとだいぶ楽になる● 100 万コース

Page 204: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える● プラス 2 万程度で OSインストールディスクを SSD 化● プラス 6 万程度でデータディスクを RAID6 化● プラス 6 万程度でメモリ 64GB 化

● CPU 16コア、メモリ 128GB以上あるとだいぶ楽になる● 100 万コース

● CPU 32コア、メモリ 1TB以上あれば最高

Page 205: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える● プラス 2 万程度で OSインストールディスクを SSD 化● プラス 6 万程度でデータディスクを RAID6 化● プラス 6 万程度でメモリ 64GB 化

● CPU 16コア、メモリ 128GB以上あるとだいぶ楽になる● 100 万コース

● CPU 32コア、メモリ 1TB以上あれば最高● 500 万コース

Page 206: 20160324自由集会講演

必要なハードウェアスペック

● CPU 4コア、メモリ 32GBが下限● 20 万くらいで買える● プラス 2 万程度で OSインストールディスクを SSD 化● プラス 6 万程度でデータディスクを RAID6 化● プラス 6 万程度でメモリ 64GB 化

● CPU 16コア、メモリ 128GB以上あるとだいぶ楽になる● 100 万コース

● CPU 32コア、メモリ 1TB以上あれば最高● 500 万コース