「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜...

151
「数字を見せろ」から 「コードを見せろ」へ Show me your code, in addition to the numbers! Keiichiro Ono (Twitter: @c_z) UC, San Diego Department of Medicine 過程の透明性を確保したデータ可視化を目指す

Transcript of 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜...

Page 1: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

「数字を見せろ」から 「コードを見せろ」へ

Show me your code, in addition to the numbers!

Keiichiro Ono (Twitter: @c_z) UC, San Diego

Department of Medicine

過程の透明性を確保したデータ可視化を目指す

Page 2: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Agenda 今日お話すること

Page 3: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

自己紹介: 生物学と可視化

可視化実践者の目指すべきゴール

分野の壁を超える

結果の共有からプロセスの共有へ

Page 4: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Keiichiro Ono

BackgroundBioinformatics

Computer ScienceWork

ResearchBioinformatics workflow

Visualization pipeline

Data

VisualizationNetworks

Other Biological Data

Integration

Molecular Interactions

Pathways

Annotations

Software Development

CytoscapeNeXO

Cyberinfrastructure

All kinds of small tools

Like

ArtKandinsky

Mondrian

Music

Electronica

TechnoMinimal

Detroit

Jazz

Sci-fiMovie

Novel

Life

US

San DiegoSan Francisco Bay Area

Los Angeles

Orange County

JapanGifu

Tokyo

Page 5: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Keiichiro Ono

BackgroundBioinformatics

Computer ScienceWork

ResearchBioinformatics workflow

Visualization pipeline

Data

VisualizationNetworks

Other Biological Data

Integration

Molecular Interactions

Pathways

Annotations

Software Development

CytoscapeNeXO

Cyberinfrastructure

All kinds of small tools

Like

ArtKandinsky

Mondrian

Music

Electronica

TechnoMinimal

Detroit

Jazz

Sci-fiMovie

Novel

Life

US

San DiegoSan Francisco Bay Area

Los Angeles

Orange County

JapanGifu

Tokyo

Page 6: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Keiichiro Ono

BackgroundBioinformatics

Computer ScienceWork

ResearchBioinformatics workflow

Visualization pipeline

Data

VisualizationNetworks

Other Biological Data

Integration

Molecular Interactions

Pathways

Annotations

Software Development

CytoscapeNeXO

Cyberinfrastructure

All kinds of small tools

Like

ArtKandinsky

Mondrian

Music

Electronica

TechnoMinimal

Detroit

Jazz

Sci-fiMovie

Novel

Life

US

San DiegoSan Francisco Bay Area

Los Angeles

Orange County

JapanGifu

Tokyo

Page 7: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Keiichiro Ono

BackgroundBioinformatics

Computer ScienceWork

ResearchBioinformatics workflow

Visualization pipeline

Data

VisualizationNetworks

Other Biological Data

Integration

Molecular Interactions

Pathways

Annotations

Software Development

CytoscapeNeXO

Cyberinfrastructure

All kinds of small tools

Like

ArtKandinsky

Mondrian

Music

Electronica

TechnoMinimal

Detroit

Jazz

Sci-fiMovie

Novel

Life

US

San DiegoSan Francisco Bay Area

Los Angeles

Orange County

JapanGifu

Tokyo

Page 8: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Cytoscape: Open Source Platform for Network Analysis and Visualization

Page 9: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 10: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

計算機科学 生物学

Page 11: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

計算機科学 生物学

Page 12: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

計算機科学 Bioinformatics

Page 13: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Bioinformatics?

Page 14: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

ゲノムワイド関連解析

一塩基多型

エピジェネティクス

DNAマイクロアレイ

遺伝子オントロジーBALST

eQTL

パスウェイ解析

次世代シーケンサー

メタボロームトランスクリプトーム

Page 15: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

?

Page 16: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 17: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Bioinformatics

Page 18: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

https://flic.kr/p/5fJ4U4

Page 19: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

>gi|10313991|ref|NC_002549.1| Zaire ebolavirus isolate Ebola virus/H.sapiens-tc/COD/1976/Yambuku-Mayinga, complete genome CGGACACACAAAAAGAAAGAAGAATTTTTAGGATCTTTTGTGTGCGAATAACTATGAGGAAGATTAATAA TTTTCCTCTCATTGAAATTTATATCGGAATTTAAATTGAAATTGTTACTGTAATCACACCTGGTTTGTTT CAGAGCCACATCACAAAGATAGAGAACAACCTAGGTCTCCGAAGGGAGCAAGGGCATCAGTGTGCTCAGT TGAAAATCCCTTGTCAACACCTAGGTCTTATCACATCACAAGTTCCACCTCAGACTCTGCAGGGTGATCC AACAACCTTAATAGAAACATTATTGTTAAAGGACAGCATTAGTTCACAGTCAAACAAGCAAGATTGAGAA TTAACCTTGGTTTTGAACTTGAACACTTAGGGGATTGAAGATTCAACAACCCTAAAGCTTGGGGTAAAAC ATTGGAAATAGTTAAAAGACAAATTGCTCGGAATCACAAAATTCCGAGTATGGATTCTCGTCCTCAGAAA ATCTGGATGGCGCCGAGTCTCACTGAATCTGACATGGATTACCACAAGATCTTGACAGCAGGTCTGTCCG TTCAACAGGGGATTGTTCGGCAAAGAGTCATCCCAGTGTATCAAGTAAACAATCTTGAAGAAATTTGCCA ACTTATCATACAGGCCTTTGAAGCAGGTGTTGATTTTCAAGAGAGTGCGGACAGTTTCCTTCTCATGCTT TGTCTTCATCATGCGTACCAGGGAGATTACAAACTTTTCTTGGAAAGTGGCGCAGTCAAGTATTTGGAAG GGCACGGGTTCCGTTTTGAAGTCAAGAAGCGTGATGGAGTGAAGCGCCTTGAGGAATTGCTGCCAGCAGT ATCTAGTGGAAAAAACATTAAGAGAACACTTGCTGCCATGCCGGAAGAGGAGACAACTGAAGCTAATGCC GGTCAGTTTCTCTCCTTTGCAAGTCTATTCCTTCCGAAATTGGTAGTAGGAGAAAAGGCTTGCCTTGAGA AGGTTCAAAGGCAAATTCAAGTACATGCAGAGCAAGGACTGATACAATATCCAACAGCTTGGCAATCAGT AGGACACATGATGGTGATTTTCCGTTTGATGCGAACAAATTTTCTGATCAAATTTCTCCTAATACACCAA GGGATGCACATGGTTGCCGGGCATGATGCCAACGATGCTGTGATTTCAAATTCAGTGGCTCAAGCTCGTT TTTCAGGCTTATTGATTGTCAAAACAGTACTTGATCATATCCTACAAAAGACAGAACGAGGAGTTCGTCT CCATCCTCTTGCAAGGACCGCCAAGGTAAAAAATGAGGTGAACTCCTTTAAGGCTGCACTCAGCTCCCTG GCCAAGCATGGAGAGTATGCTCCTTTCGCCCGACTTTTGAACCTTTCTGGAGTAAATAATCTTGAGCATG GTCTTTTCCCTCAACTATCGGCAATTGCACTCGGAGTCGCCACAGCACACGGGAGTACCCTCGCAGGAGT AAATGTTGGAGAACAGTATCAACAACTCAGAGAGGCTGCCACTGAGGCTGAGAAGCAACTCCAACAATAT GCAGAGTCTCGCGAACTTGACCATCTTGGACTTGATGATCAGGAAAAGAAAATTCTTATGAACTTCCATC AGAAAAAGAACGAAATCAGCTTCCAGCAAACAAACGCTATGGTAACTCTAAGAAAAGAGCGCCTGGCCAA

Page 20: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Raw Data = Text

Page 21: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

ISBN:978-0-596-00492-7

Page 22: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Data Visualization

Biology

Page 23: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Biology

Page 24: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Molecular Biology in 1 Min.

Page 25: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

生命 = 精巧な分子機械

Page 26: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

DNA mRNA Protein

Central Dogma

Page 27: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

DNA Source Code

Protein Instance

Page 28: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

DNA Source Code

Protein Instance

Page 29: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

DNA 配列の類似

Sequence Similarity

Protein 機能の類似

Functional Similarity

Page 30: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

http://www.plosgenetics.org/article/info%3Adoi%2F10.1371%2Fjournal.pgen.1000128

Page 31: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Model Organism

Page 32: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 33: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

openworm.org

Page 34: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

実験手法の革新

Illumina HiSeqX (http://systems.illumina.com/content/dam/illumina-marketing/documents/products/datasheets/datasheet-hiseq-x-ten.pdf)

Page 35: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

データ量の爆発配列: DNA / アミノ酸

タンパク質の三次元構造

分子間相互作用

SNPs (一塩基多型)

文献

Page 36: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 37: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

解析と可視化への需要

膨大なデータ

Page 38: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

http://www.ebi.ac.uk/fgpt/gwas/#

Page 39: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Costanzo et al. Science. 2010 Jan 22;327(5964):425-31

Page 40: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

dx.doi.org/10.2210/rcsb_pdb/mom_2014_10

Page 41: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 42: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Biology

Page 43: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Data Visualization

Biology

Page 44: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Data Visualization

Page 45: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

計算機を使った 可視化が目指すもの

Page 46: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

What

可視化とは? もしくは「見る」ということ

Page 47: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

世界

Page 48: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

極大極小

世界

Page 49: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Powers of Tenby Charles and Ray Eames

Page 50: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Powers of Tenhttp://youtu.be/0fKBhvDjuy0

Page 51: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

http://www.nikon.co.jp/channel/universcale/

Page 52: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

http://learn.genetics.utah.edu/content/cells/scale/

Page 53: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

極大極小

世界

Page 54: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

極小

Page 55: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

https://flic.kr/p/bk4yHS

Page 56: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

https://flic.kr/p/iRtA9F

Page 57: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 58: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

極小

Page 59: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

極大

Page 60: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 61: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Hubble eXtreme Deep Fieldhttps://flic.kr/p/nyXrEr

Page 62: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

https://flic.kr/p/5Sh9qb

Page 63: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Human Interactome (Source: irefindex)

Page 64: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 65: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 66: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 67: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 68: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

データ可視化 = 光だけでは見えないものを見る

Page 69: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

–Katy Börner

“Decision making in science, industry, and politics, as well as in daily life, requires that we make sense

of data sets representing the structure and dynamics of complex systems. Analysis, navigation,

and management of these continuously evolving data sets require a new kind of data-analysis and

visualization tool we call a macroscope”

Communications of the ACM, Vol. 54 No. 3, Pages 60-69 10.1145/1897852.1897871

Page 70: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

–Katy Börner

“Decision making in science, industry, and politics, as well as in daily life, requires that we make sense

of data sets representing the structure and dynamics of complex systems. Analysis, navigation,

and management of these continuously evolving data sets require a new kind of data-analysis and

visualization tool we call a macroscope”

Communications of the ACM, Vol. 54 No. 3, Pages 60-69 10.1145/1897852.1897871

科学や産業、政治、更には日常生活における意思決定でも、複雑なシステムの構造やダイナミクスを表すデータセットを理解する必要がある。このような絶え間なく発展するデータセットを解析、ナビゲーション、そして管理するためには、我々が「マクロスコープ」と呼ぶ新たな可視化と解析のためのツールが必要である。

Page 71: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Macroscope?

Page 72: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Microscope 顕微鏡

Telescope 望遠鏡

極大極小

Page 73: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

MacroscopeMicroscope 顕微鏡

Telescope 望遠鏡

極大極小

Page 74: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Microscope TelescopeMacroscope

Page 75: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

「全体」を見渡す道具 =マクロスコープ =計算機ベースの可視化が目指すべき方向性

Page 76: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Why? なぜ可視化するのか?

Page 77: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

–Tamara Munzner

“Visualization is suitable when there is a need to augment human capabilities

rather than replace people with computational decision-making methods.”

Visualization Analysis and Design. A K Peters/CRC Press, 10/2014.

可視化の利用は、(機械学習などの)計算機的手法で人を置き換える場合ではなく、 ヒトの能力を拡張して意思決定を行う必要がある時にこそ適切である。

Page 78: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

意思決定のための ヒトの認知能力の拡張

Page 79: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

可視化は機械で置き換えられない人による意思決定のために

Page 80: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

How? ここまでの概念を念頭に置いた可視化を実際に作るには?

Page 81: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

必要な知識

Page 82: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

必要な知識• Human Computer Interaction

• Design

• Computer Science

• Domain Knowledge

• Software Engineering

• Cognitive Science

• Statistics

Page 83: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

分野の壁

https://flic.kr/p/2SqQe

Page 84: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

文化の違い• サイエンス

• ジャーナリズム

• ビジネス

• 教育

Page 85: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Science / Journalism 例:サイエンスとジャーナリズム

Page 86: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Similarity 公共性の高さ

透明性の重要度

可視化への需要

オープンデータセットの増加

Differences プロトコール共有の文化

データとコードの公開

厳密さに対する考え方

Exploratory / Presentation

Page 87: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

サイエンスでの可視化• Exploratory

• 科学者が新たな知見を得るための可視化

• Presentation

• 論文で発表するための可視化

• 学会発表のための可視化

Page 88: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

ジャーナリズムでの可視化

• Presentation

• 一般読者向けにデータを分かりやすく伝える

• Exploratory

• 有権者が意思決定(=投票等)するのを助ける

Page 89: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Is It Better to Rent or Buy? By MIKE BOSTOCK, SHAN CARTER and ARCHIE TSE

http://www.nytimes.com/interactive/2014/upshot/buy-rent-calculator.html

Page 90: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 91: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

https://flic.kr/p/6rUPaH

分野を超える協力

Page 92: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

分野の壁を超える鍵

Page 93: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Openness

Page 94: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

自分の専門知識/経験 をシェアする

• 文献

• ドメインに関する知識

• 実例

• 技術 - コード/ライブラリ/ツール

• ベストプラクティス

Page 95: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

良き質問者になれ

Page 96: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

結果の共有

😐

Page 97: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

結果とプロセスの共有

😃

Page 98: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

結果とプロセスの透明性

Page 99: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

生成 解析 可視化

Page 100: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

生成

Page 101: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

生成

• データの収集

• 実験

• 調査

• 取材

Page 102: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

生成 解析 可視化

Page 103: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

解析

Page 104: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

解析

• データの前処理

• クレンジング

• 機械可読性

• 統計解析

Page 105: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

生成 解析 可視化

Page 106: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

可視化

Page 107: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

可視化

• デザイン

• メディアの決定

• ツールの選定

• コーディング

Page 108: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

生成 解析 可視化

Page 109: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

生成 解析

可視化

Page 110: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

生成 ?

可視化

Page 111: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Openness for Every Step

Page 112: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

「数字を見せる」 だけでは不十分

Page 113: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

生成 解析 可視化

プロセス全体をオープンにする

Page 114: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

How to Implement Openness? どのようにプロセスの

オープン性を実現するのか?

Page 115: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

テクノロジーと文化の 両面から解決する

Page 116: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

テクノロジーからの アプローチ

Page 117: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

可視化技術のレイヤ

Source Code

Environment

Data

Page 118: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

可視化技術のレイヤData

Page 119: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Source Code

Environment

Data

Page 120: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Source Code

Page 121: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 122: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

The Need for Openness in Data Journalism

http://bit.ly/1ipxwXP

Brian Keegan, Ph.D.

Page 123: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Source Code

Environment

Data

Page 124: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Environment

Page 125: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 126: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Software Distribution Problem

- “It-worked-on-my-machine” syndrome

- 設定の複雑さとそれによる再現性の低下は透明性の敵

Page 127: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

What is Docker?

- Container to run applications in an isolated environment

- Application = Layer of images

- Sharable Environments

- Environments as code

Page 128: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

https://www.docker.com/whatisdocker/

Page 129: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Docker Hub

- Sharing environments as code!

- Dockerfile - Definition of your container

Page 130: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

How Docker-nized World Works?

Container 1: IPython + SciPy Stack

Your Machine

Container 2: R + Bioconductor

Container 3: Neo4j

Page 131: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Your Machine

Container 1: IPython + SciPy Stack

Container 2: R + Bioconductor

Container 3: Neo4j

Page 132: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Your Machine

Container 1: IPython + SciPy Stack

Container 2: R + Bioconductor

Container 3: Neo4j

Page 133: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Source Code

Environment

Data

Page 134: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

テクノロジーは揃いつつある

• データの管理

• ソースの履歴管理

• 解析環境の抽象化

• 柔軟性のある計算機リソース

Page 135: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

分野を超えた知識の共有

Page 136: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Affordance

aesthetics

Design Pattern

Page 137: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Design Pattern 例:デザインパターン

Page 138: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 139: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
Page 140: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

暗黙知の文書化

Page 141: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Summary まとめと提言

Page 142: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

再現可能なプロセスの ために今すぐできること

Page 143: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

–Mike Bostock

“Make your process reproducible.”

Page 144: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

技術的に過程を再現可能にする• Scaffolding

• テンプレート化

• Source Code Management

• 機械による履歴管理

• Build Automation

• 自動化

Page 145: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Prepare Data for Machines データは機械のために準備し

Write Code for Human コードは人間のために書く

Page 146: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

競争すべきところは競争し 必要のない部分はオープンに

Page 147: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

–Someone in my lab

“Human is lazy by nature”

Page 148: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

–クレイグ・ベンター

“偉大なアイデアとは実行されたアイデアだ”

Page 149: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

Thank you!

Page 150: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

2014 Keiichiro Ono [email protected]

Page 151: 「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜

• このスライドでは一部WikipediaのPD画像を利用しています。

• リンクの無い画像は大野圭一朗によるもので、全てCC BY 4.0ライセンスにて自由に再利用可能です

• リンク付きの画像は全てCCの元配布されていますが、再利用にはリンク先のライセンスをご確認下さい。