メタバーコーディングが拓く新種探索の新時代

105
The wild mushroom chase 2013 The last presentation

Transcript of メタバーコーディングが拓く新種探索の新時代

Page 1: メタバーコーディングが拓く新種探索の新時代

Thewildmushroomchase2013

Thelast

presentation

Page 2: メタバーコーディングが拓く新種探索の新時代

Presenter

発表者

水産総合研究センター

中央水産研究所

田辺 晶史Akifumi S. TanabeNational Research Institute of Fisheries Science,

Fisheries Research Agency

Page 3: メタバーコーディングが拓く新種探索の新時代

メタバーコーディング が拓く新種探索の新時代

Metabarcoding marks a new erafor exploring new taxa

Page 4: メタバーコーディングが拓く新種探索の新時代

未知の生物を

探すExploring new taxa

Page 5: メタバーコーディングが拓く新種探索の新時代

どうやって?

How?

Page 6: メタバーコーディングが拓く新種探索の新時代

目で見るobserve by eyes

Page 7: メタバーコーディングが拓く新種探索の新時代

遅いToo slow

Page 8: メタバーコーディングが拓く新種探索の新時代

そんなときにメタバーコーディングMetabarcoding isable to solve this problem

Page 9: メタバーコーディングが拓く新種探索の新時代

メタバーコーディングって何?What is “metabarcoding”?

Page 10: メタバーコーディングが拓く新種探索の新時代

土壌海水淡水

未消化物糞

遺骸生物体など

メタバーコーディングって何?What is “metabarcoding”?

soilssea waterfresh waterundigested materialsfecesdead bodiesliving bodiesetc.

Page 11: メタバーコーディングが拓く新種探索の新時代

土壌海水淡水

未消化物糞

遺骸生物体など

メタゲノム

メタバーコーディングって何?What is “metabarcoding”?

metagenomes

soilssea waterfresh waterundigested materialsfecesdead bodiesliving bodiesetc.

Page 12: メタバーコーディングが拓く新種探索の新時代

土壌海水淡水

未消化物糞

遺骸生物体など

メタゲノム 塩基配列

メタバーコーディングって何?What is “metabarcoding”?

soilssea waterfresh waterundigested materialsfecesdead bodiesliving bodiesetc.

metagenomes nucleotidesequences

Page 13: メタバーコーディングが拓く新種探索の新時代

土壌海水淡水

未消化物糞

遺骸生物体など

メタゲノム 塩基配列 生物種名

メタバーコーディングって何?What is “metabarcoding”?

soilssea waterfresh waterundigested materialsfecesdead bodiesliving bodiesetc.

metagenomes nucleotidesequences

biologicaltaxa

Page 14: メタバーコーディングが拓く新種探索の新時代

メタバーコーディングのポジティブスパイラル

メタバーコーディング

未知生物発見

従来法による記載分類

DNA データベース充実

メタバーコーディング能力向上

A positive spiral of metabarcoding

metabarcoding

discovera new taxon

describe the new taxonby existing method

expand the DNA database

improvemetabarcoding

Page 15: メタバーコーディングが拓く新種探索の新時代

土壌海水淡水

未消化物糞

遺骸生物体など

メタゲノム 塩基配列 生物種名

メタバーコーディングって何?

PCRで特定の遺伝子座を増幅サンガー法で塩基配列解読

metagenomes nucleotidesequences

biologicaltaxa

amplify a barcode locussequence by Sanger method

What is “metabarcoding”?

an oldmethod

Page 16: メタバーコーディングが拓く新種探索の新時代

土壌海水淡水

未消化物糞

遺骸生物体など

メタゲノム 塩基配列 生物種名

メタバーコーディングって何?

PCRで特定の遺伝子座を増幅同時にサンプル識別用タグ配列付加多サンプルを混合してNGSで解読

metagenomes nucleotidesequences

biologicaltaxa

amplify a barcode locusadd multiplex identifier sequence

mix and sequence by NGS

What is “metabarcoding”?

a newmethod

Page 17: メタバーコーディングが拓く新種探索の新時代

土壌海水淡水

未消化物糞

遺骸生物体など

メタゲノム 塩基配列 生物種名

メタバーコーディングって何?

近縁既知配列と多重整列分子系統樹推定

What is “metabarcoding”?

metagenomes nucleotidesequences

biologicaltaxa

multiple alignment with known relativesmolecular phylogenetic inference

an oldmethod

Page 18: メタバーコーディングが拓く新種探索の新時代

metagenomes nucleotidesequences

biologicaltaxa

土壌海水淡水

未消化物糞

遺骸生物体など

メタゲノム 塩基配列 生物種名

メタバーコーディングって何?

タグ配列に基いて由来サンプルを特定配列から低品質な部位を除去

低品質な配列を除去ノイズの多そうな配列を除去キメラと思われる配列を除去

類似度n%以上の配列をまとめる類似する既知配列からホスト生物を推定

     … demultiplexing   ……… quality-trimming …………… quality-filtering   ……… denoising   ……… chimera removal    …… clustering     … barcoding

What is “metabarcoding”?

a newmethod

Page 19: メタバーコーディングが拓く新種探索の新時代

metagenomes nucleotidesequences

biologicaltaxa

土壌海水淡水

未消化物糞

遺骸生物体など

メタゲノム 塩基配列 生物種名

メタバーコーディングって何?

タグ配列に基いて由来サンプルを特定配列から低品質な部位を除去

低品質な配列を除去ノイズの多そうな配列を除去キメラと思われる配列を除去

類似度n%以上の配列をまとめる類似する既知配列からホスト生物を推定

     … demultiplexing   ……… quality-trimming …………… quality-filtering   ……… denoising   ……… chimera removal    …… clustering     … barcoding

Claidenthttp://www.claident.org/

What is “metabarcoding”?

a newmethod

Page 20: メタバーコーディングが拓く新種探索の新時代

metagenomes nucleotidesequences

biologicaltaxa

土壌海水淡水

未消化物糞

遺骸生物体など

メタゲノム 塩基配列 生物種名

メタバーコーディングって何?

タグ配列に基いて由来サンプルを特定配列から低品質な部位を除去

低品質な配列を除去ノイズの多そうな配列を除去キメラと思われる配列を除去

類似度n%以上の配列をまとめる類似する既知配列からホスト生物を推定

     … demultiplexing   ……… quality-trimming …………… quality-filtering   ……… denoising   ……… chimera removal    …… clustering     … barcoding

Claidenthttp://www.claident.org/

What is “metabarcoding”?

a newmethod

Page 21: メタバーコーディングが拓く新種探索の新時代

植物菌根のメタバーコーディング例An example of metabarcoding

of mycorrhizae

(Toju et al. 2013)

Page 22: メタバーコーディングが拓く新種探索の新時代

interludestart

Page 23: メタバーコーディングが拓く新種探索の新時代

生物の分類は階層的に体系化されているBiological taxonomy is hierarchically systematized

Page 24: メタバーコーディングが拓く新種探索の新時代

生物の分類は階層的に体系化されている

界 kingdom

Biological taxonomy is hierarchically systematized

Page 25: メタバーコーディングが拓く新種探索の新時代

生物の分類は階層的に体系化されている

界 kingdom

門 phylum

Biological taxonomy is hierarchically systematized

Page 26: メタバーコーディングが拓く新種探索の新時代

生物の分類は階層的に体系化されている

界 kingdom

門 phylum

綱 class

Biological taxonomy is hierarchically systematized

Page 27: メタバーコーディングが拓く新種探索の新時代

生物の分類は階層的に体系化されている

界 kingdom

門 phylum

綱 class

目 order

Biological taxonomy is hierarchically systematized

Page 28: メタバーコーディングが拓く新種探索の新時代

生物の分類は階層的に体系化されている

界 kingdom

門 phylum

綱 class

目 order

科 family

Biological taxonomy is hierarchically systematized

Page 29: メタバーコーディングが拓く新種探索の新時代

生物の分類は階層的に体系化されている

界 kingdom

門 phylum

綱 class

目 order

科 family

属 genus

Biological taxonomy is hierarchically systematized

Page 30: メタバーコーディングが拓く新種探索の新時代

生物の分類は階層的に体系化されている

界 kingdom

門 phylum

綱 class

目 order

科 family

属 genus

種 species

Biological taxonomy is hierarchically systematized

Page 31: メタバーコーディングが拓く新種探索の新時代

生物の所属分類群を特定=同定すると、様々なことがわかるTaxonomic identification gives us

a lot of information

Page 32: メタバーコーディングが拓く新種探索の新時代

生物の所属分類群を特定=同定すると、様々なことがわかる

● 生態

Taxonomic identification gives us a lot of information

Ecology

Page 33: メタバーコーディングが拓く新種探索の新時代

生物の所属分類群を特定=同定すると、様々なことがわかる

● 生態

● 寿命,最大・平均・最小サイズ,生息環境,分布域, etc.

Taxonomic identification gives us a lot of information

Ecology

life history, body size, habitat, distribution, etc.

Page 34: メタバーコーディングが拓く新種探索の新時代

生物の所属分類群を特定=同定すると、様々なことがわかる

● 生態

● 寿命,最大・平均・最小サイズ,生息環境,分布域, etc.

● 近縁の分類群

Taxonomic identification gives us a lot of information

Ecology

Closely related taxa

life history, body size, habitat, distribution, etc.

Page 35: メタバーコーディングが拓く新種探索の新時代

生物の所属分類群を特定=同定すると、様々なことがわかる

● 生態

● 寿命,最大・平均・最小サイズ,生息環境,分布域, etc.

● 近縁の分類群

● ヒトであればチンパンジー,ライオンであればネコ, etc.

Taxonomic identification gives us a lot of information

Ecology

Closely related taxa

life history, body size, habitat, distribution, etc.

chimps for humans, lions for cats, etc.

Page 36: メタバーコーディングが拓く新種探索の新時代

より下位の階層まで同じ分類群は、より似ているOrganisms which belong same lower taxa

are more similar

Page 37: メタバーコーディングが拓く新種探索の新時代

より下位の階層まで同じ分類群は、より似ている

● 既知生物に似ているほど下位の階層まで同定可能

Organisms which belong same lower taxaare more similar

An organism which is more similar to known organismsis identifiable to lower taxa

Page 38: メタバーコーディングが拓く新種探索の新時代

より下位の階層まで同じ分類群は、より似ている

● 既知生物に似ているほど下位の階層まで同定可能

● より下位の階層(種とか)まで同定できるとより詳細にわかる

Organisms which belong same lower taxaare more similar

An organism which is more similar to known organismsis identifiable to lower taxa

Lower taxonomic information providesmore detailed ecological information

Page 39: メタバーコーディングが拓く新種探索の新時代

interludeend

Page 40: メタバーコーディングが拓く新種探索の新時代

DNA→ 分類情報

Translating DNA intotaxonomic information

Page 41: メタバーコーディングが拓く新種探索の新時代

どうやって?

How?

Page 42: メタバーコーディングが拓く新種探索の新時代

新規準A new criterion for molecular identification

Page 43: メタバーコーディングが拓く新種探索の新時代

新規準

問い合わせ配列と最近隣配列間の変異量

A new criterion for molecular identification

distance between query and nearest-neighbor

Page 44: メタバーコーディングが拓く新種探索の新時代

新規準

問い合わせ配列と最近隣配列間の変異量

同定結果分類群内の最大変異量<

A new criterion for molecular identification

distance between query and nearest-neighbor

maximum distance within resulting taxon

Page 45: メタバーコーディングが拓く新種探索の新時代

イメージ図

既知配列 B

既知配列 A

問い合わせ配列

配列空間

A schematic illustrationsequence space

known sequence A

known sequence B

query sequence

Page 46: メタバーコーディングが拓く新種探索の新時代

イメージ図

既知配列 B

既知配列 A

問い合わせ配列

属 genus Ω種 species α

属 genus Ω種 species β

配列空間

A schematic illustrationsequence space

known sequence A

known sequence B

query sequence

Page 47: メタバーコーディングが拓く新種探索の新時代

known sequence B

イメージ図

既知配列 B

既知配列 A

問い合わせ配列属

Ω の変異の範囲

配列空間

A schematic illustrationsequence space

known sequence A

query sequenceva

riable

range o

f gen

us Ω

Page 48: メタバーコーディングが拓く新種探索の新時代

known sequence A

known sequence B

query sequence

イメージ図

既知配列 B

既知配列 A

問い合わせ配列属

Ω の変異の範囲

属 genus Ω種 species ?

配列空間

A schematic illustrationsequence space

varia

ble ran

ge of g

enus Ω

Page 49: メタバーコーディングが拓く新種探索の新時代

NN-centric auto-k-NN method

問い合わせ配列

配列空間 sequence space

query sequence

Page 50: メタバーコーディングが拓く新種探索の新時代

NN-centric auto-k-NN method1. 最近隣配列 (A) を探し出して変異量 (DQA) を算出

問い合わせ配列A

DQA

配列空間 sequence space

query sequence

Retrieve nearest-neighbor (A), and calculate distance from query (DQA)

Page 51: メタバーコーディングが拓く新種探索の新時代

NN-centric auto-k-NN method1. 最近隣配列 (A) を探し出して変異量 (DQA) を算出2. DAB>DQA を満たす配列のうち最も A に近い配列 (B) を得る

A

DQA問い合わせ配列

配列空間

B

sequence space

query sequence

Retrieve borderline (B),which is nearest to A in the sequences farther from A than Q

Page 52: メタバーコーディングが拓く新種探索の新時代

NN-centric auto-k-NN method1. 最近隣配列 (A) を探し出して変異量 (DQA) を算出2. DAB>DQA を満たす配列のうち最も A に近い配列 (B) を得る3. DAN≤DAB を満たす全ての配列 (N) を得る

A

DAB

B

N

N

N問い合わせ配列

配列空間 sequence space

query sequence

Retrieve all sequences (Ns) filling DAN≤DAB

Page 53: メタバーコーディングが拓く新種探索の新時代

NN-centric auto-k-NN method1. 最近隣配列 (A) を探し出して変異量 (DQA) を算出2. DAB>DQA を満たす配列のうち最も A に近い配列 (B) を得る3. DAN≤DAB を満たす全ての配列 (N) を得る4. A, B, N の全配列で共通する分類群を採用

A

DAB

B

N

N

N問い合わせ配列

配列空間 sequence space

query sequence

Accept a taxon common to A, B, and Ns

Page 54: メタバーコーディングが拓く新種探索の新時代

sequence space

NN-centric auto-k-NN method1. 最近隣配列 (A) を探し出して変異量 (DQA) を算出2. DAB>DQA を満たす配列のうち最も A に近い配列 (B) を得る3. DAN≤DAB を満たす全ての配列 (N) を得る4. A, B, N の全配列で共通する分類群を採用

A

DAB

B

N

N

N問い合わせ配列

配列空間

問い合わせ配列と最近隣配列間の変異量

DQA

DAB

同定結果分類群内の最大変異量<

≤=

query sequence

distance between query and nearest-neighbor

maximum distance within resulting taxon

Page 55: メタバーコーディングが拓く新種探索の新時代

Query-centric auto-k-NN method

問い合わせ配列

配列空間 sequence space

query sequence

Page 56: メタバーコーディングが拓く新種探索の新時代

Query-centric auto-k-NN method1. 最近隣配列 (A) を探し出して変異量 (DQA) を算出

問い合わせ配列A

DQA

配列空間 sequence space

query sequence

Retrieve nearest-neighbor (A), and calculate distance from query (DQA)

Page 57: メタバーコーディングが拓く新種探索の新時代

Query-centric auto-k-NN method1. 最近隣配列 (A) を探し出して変異量 (DQA) を算出2. DAB>DQA を満たす配列のうち最も A に近い配列 (B) を得る

A

DQA問い合わせ配列

配列空間

B

sequence space

query sequence

Retrieve borderline (B),which is nearest to A in the sequences farther from A than Q

Page 58: メタバーコーディングが拓く新種探索の新時代

Query-centric auto-k-NN method1. 最近隣配列 (A) を探し出して変異量 (DQA) を算出2. DAB>DQA を満たす配列のうち最も A に近い配列 (B) を得る3. DQN≤DQB を満たすすべての配列 (N) を得る

A

DQB

N

N

N

問い合わせ配列

配列空間

B

sequence space

query sequence

Retrieve all sequences (Ns) filling DQN≤DQB

Page 59: メタバーコーディングが拓く新種探索の新時代

Query-centric auto-k-NN method1. 最近隣配列 (A) を探し出して変異量 (DQA) を算出2. DAB>DQA を満たす配列のうち最も A に近い配列 (B) を得る3. DQN≤DQB を満たすすべての配列 (N) を得る4. A, B, N の全配列で共通する分類群を採用

A

DQB

N

N

N

問い合わせ配列

配列空間

B

sequence space

query sequence

Accept a taxon common to A, B, and Ns

Page 60: メタバーコーディングが拓く新種探索の新時代

sequence space

Query-centric auto-k-NN method1. 最近隣配列 (A) を探し出して変異量 (DQA) を算出2. DAB>DQA を満たす配列のうち最も A に近い配列 (B) を得る3. DQN≤DQB を満たすすべての配列 (N) を得る4. A, B, N の全配列で共通する分類群を採用

A

DQB

N

N

N

問い合わせ配列

配列空間

B

配列空間

問い合わせ配列と最近隣配列間の変異量

DQA

DQB

同定結果分類群内の最大変異量

<≤

=query sequence

distance between query and nearest-neighbor

maximum distance within resulting taxon

Page 61: メタバーコーディングが拓く新種探索の新時代

従来法との比較 1

DNA database

Comparing with existing methods 1

human ACATAGC…chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

Page 62: メタバーコーディングが拓く新種探索の新時代

従来法との比較 1

DNA database

human ACATAGC…

無作為に1 本抜く

Comparing with existing methods 1

human ACATAGC…chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

picka sequence

Page 63: メタバーコーディングが拓く新種探索の新時代

従来法との比較 1

DNA database

human ACATAGC…

無作為に1 本抜く

Comparing with existing methods 1

human ACATAGC…chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

DNA database lacking 1 sequence

picka sequence

Page 64: メタバーコーディングが拓く新種探索の新時代

従来法との比較 1

DNA database

human ACATAGC…

human の DNA を右のデータベースを使ってプログラムで同定して正解かどうかを調べる

無作為に1 本抜く

Comparing with existing methods 1

human ACATAGC…chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

DNA database lacking 1 sequence

picka sequence

identify human DNA by programswith DNA database lacking human DNA

Page 65: メタバーコーディングが拓く新種探索の新時代

従来法との比較 1

DNA database

human ACATAGC…

human の DNA を右のデータベースを使ってプログラムで同定して正解かどうかを調べる

無作為に1 本抜く

Comparing with existing methods 1

human ACATAGC…chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

DNA database lacking 1 sequence

picka sequence

identify human DNA by programswith DNA database lacking human DNA

抜き取った DNA はプログラムからは未知のものになる

Picked DNA seems to be“unknown sequence”from programs

Page 66: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 67: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

1NNはよく落ちるが誤同定多数

Too many misidentificationswere produced by 1NN method

Page 68: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

97%NN, 99%NN,Barcoder, ConstrainedNJは、門レベルすら落とせない

ことが頻繁にある97%NN, 99%NN, Barcoder, ConstrainedNJ werenot able to identify the sequences even at phylum-level

Page 69: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentifiedNNC, QC は門~科まではよく落とせている

NNC and QC frequently produced correct identificationat phylum-, class-, order-, and family-level.

Page 70: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

5NNは NNC, QCとよく似た結果

5NN produced similar results to NNC and QC

Page 71: メタバーコーディングが拓く新種探索の新時代

従来法との比較 2

DNA database

human ACATAGC…

無作為に1 本抜く

Comparing with existing methods 2

human ACATAGC…chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

picka sequence

Page 72: メタバーコーディングが拓く新種探索の新時代

従来法との比較 2

DNA database

human ACATAGC…

無作為に1 本抜く

Comparing with existing methods 2

human ACATAGC…chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

cow TACGTCT…cat GCTGTGT…

DNA database lacking all seqs of a order

picka sequence

Page 73: メタバーコーディングが拓く新種探索の新時代

従来法との比較 2

DNA database

human ACATAGC…

human の DNA を右のデータベースを使ってプログラムで同定して正解かどうかを調べる

無作為に1 本抜く

Comparing with existing methods 2

human ACATAGC…chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

cow TACGTCT…cat GCTGTGT…

DNA database lacking all seqs of a order

picka sequence

identify human DNA by programswith DNA database lacking all DNA of a order

Page 74: メタバーコーディングが拓く新種探索の新時代

従来法との比較 2

DNA database

human ACATAGC…

human の DNA を右のデータベースを使ってプログラムで同定して正解かどうかを調べる

無作為に1 本抜く

Comparing with existing methods 2

human ACATAGC…chimp ACATTCT…cow TACGTCT…cat GCTGTGT…

cow TACGTCT…cat GCTGTGT…

DNA database lacking all seqs of a order

picka sequence

identify human DNA by programswith DNA database lacking all DNA of a order

抜き取った DNA の「目」はプログラムからは未知のものになる

Picked DNA seems to be“unknown order”from programs

Page 75: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-order-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 76: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-order-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentifiedphylum, class では5NN, NNC, QCはよく似た結果

Page 77: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-order-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

order の誤同定は5NN > NNC > QC

Page 78: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-order-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

family でも5NN > NNC > QC

Page 79: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-family-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 80: メタバーコーディングが拓く新種探索の新時代

Results of leave-one-genus-out cross-validation

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 81: メタバーコーディングが拓く新種探索の新時代

まとめ

● QCauto method...● 多重整列が不要● 既知系統樹が不要● どの遺伝子座でも適用可能● どの分類群にも適用可能● 前処理に時間がかからない● 同定処理に時間がかからない● 理論的背景がある● 「既知の綱の未知の目」といった答えを正しく出す

is multiple alignment free

is phylogenetic tree free

is locus independent

is taxon independent

is fast in preprocess

is fast in identification process

has theoretical background

can find unknown order of existing class

Conclusion

Page 82: メタバーコーディングが拓く新種探索の新時代

QCauto 法はポジティブスパイラルを加速する

メタバーコーディング

未知生物発見

従来法による記載分類

DNA データベース充実

メタバーコーディング能力向上

QCauto method accelerates positive spiral

metabarcoding

discovera new taxon

describe the new taxonby existing method

expand the DNA database

improvemetabarcoding

Page 83: メタバーコーディングが拓く新種探索の新時代

QCauto 法はポジティブスパイラルを加速する

メタバーコーディング

未知生物発見

従来法による記載分類

DNA データベース充実

メタバーコーディング能力向上

QCauto method accelerates positive spiral

metabarcoding

discovera new taxon

describe the new taxonby existing method

expand the DNA database

improvemetabarcoding

Bottleneck

Page 84: メタバーコーディングが拓く新種探索の新時代
Page 85: メタバーコーディングが拓く新種探索の新時代

誤同定の要因

● 見かけ上の誤同定● 問い合わせ配列の同定情報が間違っている● 既知配列の同定情報が間違っている● 分類体系が系統関係を反映していない

● 本当の誤同定● バーコード領域が incomplete lineage sorting や浸透交雑・水平

伝播によって種の系統関係を反映していない● 変異量の指標 (BLAST raw score)が不適● 規準が不適

Page 86: メタバーコーディングが拓く新種探索の新時代

全分類群全遺伝子座での LOOCV 結果

correctly identified incorrectly identified cannot identified but incorrectly identified at higher-level cannot identified

属レベルが最も誤同定が多い

Page 87: メタバーコーディングが拓く新種探索の新時代

属レベルで誤同定が多いのは何故か ?

● 種を記載するとき、無理にでも属は指定する必要がある

● 系統関係と整合的でない分類群が属で設立されやすいのでは ?● 正しくない属に入れられてしまう種も多いのでは ?

Page 88: メタバーコーディングが拓く新種探索の新時代

誤同定の要因

● 見かけ上の誤同定● 問い合わせ配列の同定情報が間違っている● 既知配列の同定情報が間違っている● 分類体系が系統関係を反映していない

● 本当の誤同定● バーコード領域が incomplete lineage sorting や浸透交雑・水平

伝播によって種の系統関係を反映していない● 変異量の指標 (BLAST raw score)が不適● 規準が不適

「属レベルが最も誤同定が多い」のは、これが多いことを示している ?

Page 89: メタバーコーディングが拓く新種探索の新時代

複数の同定結果を優先順位を付けて統合する

● 複数の既知配列データベースでの同定結果● 種以下まで情報がある既知配列のみのデータベースでの同定結果● 科以下まで情報がある既知配列のみのデータベースでの同定結果

● 厳しい制約下の同定結果と制約を緩めた同定結果● 類似配列の厳密一致分類群を採用した同定結果● 類似配列の 90%多数決合意分類群を採用した同定結果

● 複数の遺伝子座での同定結果● 遺伝子座 A の配列での同定結果● 遺伝子座 B の配列での同定結果

Page 90: メタバーコーディングが拓く新種探索の新時代

優先度 綱 目 科 属 種

高 哺乳綱 霊長目 ヒト科

低 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

複数の同定結果を優先順位を付けて統合する

綱 目 科 属 種

統合結果 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

Page 91: メタバーコーディングが拓く新種探索の新時代

優先度 綱 目 科 属 種

高 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ

低 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

複数の同定結果を優先順位を付けて統合する

綱 目 科 属 種

統合結果 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ

Page 92: メタバーコーディングが拓く新種探索の新時代

優先度 綱 目 科 属 種

同 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ

同 哺乳綱 霊長目 ヒト科 ヒト属 ヒト

複数の同定結果を優先順位を付けて統合する

綱 目 科 属 種

統合結果 哺乳綱 霊長目 ヒト科

Page 93: メタバーコーディングが拓く新種探索の新時代

優先度 綱 目 科 属 種

同 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ

同 哺乳綱 霊長目 ヒト科 ヒト属

複数の同定結果を優先順位を付けて統合する

綱 目 科 属 種

統合結果 哺乳綱 霊長目 ヒト科 ゴリラ属 ゴリラ

Page 94: メタバーコーディングが拓く新種探索の新時代

動物 COX1 での no-LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 95: メタバーコーディングが拓く新種探索の新時代

動物 COX1 での LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 96: メタバーコーディングが拓く新種探索の新時代

細菌 16S での no-LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 97: メタバーコーディングが拓く新種探索の新時代

細菌 16S での LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 98: メタバーコーディングが拓く新種探索の新時代

真菌 ITS での no-LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 99: メタバーコーディングが拓く新種探索の新時代

真菌 ITS での LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 100: メタバーコーディングが拓く新種探索の新時代

植物 matK での no-LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 101: メタバーコーディングが拓く新種探索の新時代

植物 matK での LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 102: メタバーコーディングが拓く新種探索の新時代

植物 rbcL での no-LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 103: メタバーコーディングが拓く新種探索の新時代

植物 rbcL での LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

Page 104: メタバーコーディングが拓く新種探索の新時代

植物 trnH-psbA での no-LOOCV 結果

Page 105: メタバーコーディングが拓く新種探索の新時代

植物 trnH-psbA での LOOCV 結果

correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified