TogoTable (事例紹介)ms-bio.info/images/171126BH1711_kawano.pdf · Music Brainz (zitgist)...
Transcript of TogoTable (事例紹介)ms-bio.info/images/171126BH1711_kawano.pdf · Music Brainz (zitgist)...
Licensed under CC-BY 4.0 ©2016 YOUR NAME(DBCLS)Licensed under CC-BY 4.0 ©2017 SHIN KAWANO (DBCLS/NBDC)
TogoTable (事例紹介)
情報・システム研究機構 データサイエンス共同利用基盤施設 ライフサイエンス統合データベースセンター(DBCLS) 科学技術振興機構 バイオサイエンスデータベースセンター(NBDC)
河野 信
©2013 Shin Kawano Licensed Under CC 表示 2.1 日本
TogoTable
RDFでつながったデータから様々なアノテーションを取得して表に追加
2
http://togotable.dbcls.jp/
As of September 2011
MusicBrainz
(zitgist)
P20
Turismo de
Zaragoza
yovisto
Yahoo! Geo
Planet
YAGO
World Fact-book
El ViajeroTourism
WordNet (W3C)
WordNet (VUA)
VIVO UF
VIVO Indiana
VIVO Cornell
VIAF
URIBurner
Sussex Reading
Lists
Plymouth Reading
Lists
UniRef
UniProt
UMBEL
UK Post-codes
legislationdata.gov.uk
Uberblic
UB Mann-heim
TWC LOGD
Twarql
transportdata.gov.
uk
Traffic Scotland
theses.fr
Thesau-rus W
totl.net
Tele-graphis
TCMGeneDIT
TaxonConcept
Open Library (Talis)
tags2con delicious
t4gminfo
Swedish Open
Cultural Heritage
Surge Radio
Sudoc
STW
RAMEAU SH
statisticsdata.gov.
uk
St. Andrews Resource
Lists
ECS South-ampton EPrints
SSW Thesaur
us
SmartLink
Slideshare2RDF
semanticweb.org
SemanticTweet
Semantic XBRL
SWDog Food
Source Code Ecosystem Linked Data
US SEC (rdfabout)
Sears
Scotland Geo-
graphy
ScotlandPupils &Exams
Scholaro-meter
WordNet (RKB
Explorer)
Wiki
UN/LOCODE
Ulm
ECS (RKB
Explorer)
Roma
RISKS
RESEX
RAE2001
Pisa
OS
OAI
NSF
New-castle
LAASKISTI
JISC
IRIT
IEEE
IBM
Eurécom
ERA
ePrints dotAC
DEPLOY
DBLP (RKB
Explorer)
Crime Reports
UK
Course-ware
CORDIS (RKB
Explorer)CiteSeer
Budapest
ACM
riese
Revyu
researchdata.gov.
ukRen. Energy Genera-
tors
referencedata.gov.
uk
Recht-spraak.
nl
RDFohloh
Last.FM (rdfize)
RDF Book
Mashup
Rådata nå!
PSH
Product Types
Ontology
ProductDB
PBAC
Poké-pédia
patentsdata.go
v.uk
OxPoints
Ord-nance Survey
Openly Local
Open Library
OpenCyc
Open Corpo-rates
OpenCalais
OpenEI
Open Election
Data Project
OpenData
Thesau-rus
Ontos News Portal
OGOLOD
JanusAMP
Ocean Drilling Codices
New York
Times
NVD
ntnusc
NTU Resource
Lists
Norwe-gian
MeSH
NDL subjects
ndlna
myExperi-ment
Italian Museums
medu-cator
MARC Codes List
Man-chester Reading
Lists
Lotico
Weather Stations
London Gazette
LOIUS
Linked Open Colors
lobidResources
lobidOrgani-sations
LEM
LinkedMDB
LinkedLCCN
LinkedGeoData
LinkedCT
LinkedUser
FeedbackLOV
Linked Open
Numbers
LODE
Eurostat (OntologyCentral)
Linked EDGAR
(OntologyCentral)
Linked Crunch-
base
lingvoj
Lichfield Spen-ding
LIBRIS
Lexvo
LCSH
DBLP (L3S)
Linked Sensor Data (Kno.e.sis)
Klapp-stuhl-club
Good-win
Family
National Radio-activity
JP
Jamendo (DBtune)
Italian public
schools
ISTAT Immi-gration
iServe
IdRef Sudoc
NSZL Catalog
Hellenic PD
Hellenic FBD
PiedmontAccomo-dations
GovTrack
GovWILD
GoogleArt
wrapper
gnoss
GESIS
GeoWordNet
GeoSpecies
GeoNames
GeoLinkedData
GEMET
GTAA
STITCH
SIDER
Project Guten-berg
MediCare
Euro-stat
(FUB)
EURES
DrugBank
Disea-some
DBLP (FU
Berlin)
DailyMed
CORDIS(FUB)
Freebase
flickr wrappr
Fishes of Texas
Finnish Munici-palities
ChEMBL
FanHubz
EventMedia
EUTC Produc-
tions
Eurostat
Europeana
EUNIS
EU Insti-
tutions
ESD stan-dards
EARTh
Enipedia
Popula-tion (En-AKTing)
NHS(En-
AKTing) Mortality(En-
AKTing)
Energy (En-
AKTing)
Crime(En-
AKTing)
CO2 Emission
(En-AKTing)
EEA
SISVU
education.data.g
ov.uk
ECS South-ampton
ECCO-TCP
GND
Didactalia
DDC Deutsche Bio-
graphie
datadcs
MusicBrainz
(DBTune)
Magna-tune
John Peel
(DBTune)
Classical (DB
Tune)
AudioScrobbler (DBTune)
Last.FM artists
(DBTune)
DBTropes
Portu-guese
DBpedia
dbpedia lite
Greek DBpedia
DBpedia
data-open-ac-uk
SMCJournals
Pokedex
Airports
NASA (Data Incu-bator)
MusicBrainz(Data
Incubator)
Moseley Folk
Metoffice Weather Forecasts
Discogs (Data
Incubator)
Climbing
data.gov.uk intervals
Data Gov.ie
databnf.fr
Cornetto
reegle
Chronic-ling
America
Chem2Bio2RDF
Calames
businessdata.gov.
uk
Bricklink
Brazilian Poli-
ticians
BNB
UniSTS
UniPathway
UniParc
Taxonomy
UniProt(Bio2RDF)
SGD
Reactome
PubMedPub
Chem
PRO-SITE
ProDom
Pfam
PDB
OMIMMGI
KEGG Reaction
KEGG Pathway
KEGG Glycan
KEGG Enzyme
KEGG Drug
KEGG Com-pound
InterPro
HomoloGene
HGNC
Gene Ontology
GeneID
Affy-metrix
bible ontology
BibBase
FTS
BBC Wildlife Finder
BBC Program
mes BBC Music
Alpine Ski
Austria
LOCAH
Amster-dam
Museum
AGROVOC
AEMET
US Census (rdfabout)
Media
Geographic
Publications
Government
Cross-domain
Life sciences
User-generated content
Licensed under CC-BY 4.0 ©2016 YOUR NAME(DBCLS)Licensed under CC-BY 4.0 ©2017 SHIN KAWANO (DBCLS/NBDC)
プロテオームデータの標準化と データベースの世界動向
情報・システム研究機構 データサイエンス共同利用基盤施設 ライフサイエンス統合データベースセンター(DBCLS) 科学技術振興機構 バイオサイエンスデータベースセンター(NBDC)
河野 信
Licensed under CC-BY 4.0 ©2016 YOUR NAME(DBCLS)Licensed under CC-BY 4.0 ©2017 SHIN KAWANO (DBCLS/NBDC)
NGS vs MS
NGS MS
生データ FASTQ .raw/.wiff/.baf …
解析ソフトウェア マルチプラットフォーム オープンなものが多い
中にはWindows専用のものも ようやくオープンスースなものがポツ
ポツと
TopHat/Bowtie/Cufflinks/GATKMascot/X! tandem/ProteinPilot/
MaxQuant/Skyline…
解析データフォーマット SAM/BAM/VCF mzML/mzIdentML/mzQuantML
Licensed under CC-BY 4.0 ©2016 YOUR NAME(DBCLS)Licensed under CC-BY 4.0 ©2017 SHIN KAWANO (DBCLS/NBDC)
Proteomics Standards Initiative
Licensed under CC-BY 4.0 ©2016 YOUR NAME(DBCLS)Licensed under CC-BY 4.0 ©2017 SHIN KAWANO (DBCLS/NBDC)
HUPO-PSI standards
jmzML
jmzIdenML
jmzQuantML
jmzTab
Software/Tools
Licensed under CC-BY 4.0 ©2016 YOUR NAME(DBCLS)Licensed under CC-BY 4.0 ©2017 SHIN KAWANO (DBCLS/NBDC)
再解析データ登録ガイドライン
Licensed under CC-BY 4.0 ©2016 YOUR NAME(DBCLS)Licensed under CC-BY 4.0 ©2017 SHIN KAWANO (DBCLS/NBDC)
Universal Spectral Identifier
・データセット中の個々のスペクトルデータを指し示すためのIDを設計 ・ペプチド同定結果をスペクトルにさかのぼって確認する ・Spectral Libraryを作成した際のスペクトルを指定する
mzspec:<collection>:<subfolder>:<msRun>:<indexType>:<scanNumber>
mzspec:PXD000561:Control01:Adult_Frontalcortex_bRP_Elite_85_f09:scan:17555
Licensed under CC-BY 4.0 ©2016 YOUR NAME(DBCLS)Licensed under CC-BY 4.0 ©2017 SHIN KAWANO (DBCLS/NBDC)
Controlled Vocabulary (CV)
PSI-MS • Controlled Vocabularyであってオントロジーではない
• OBOに登録されてはいるが、Class/Property/Entity等の関係が整理されていない → ただひたすらに語彙が追加されるのみ
PSI-MOD • 更新停止中
• やる人がいないから • UNI-MODの利用を推奨
Licensed under CC-BY 4.0 ©2016 YOUR NAME(DBCLS)Licensed under CC-BY 4.0 ©2017 SHIN KAWANO (DBCLS/NBDC)
ProteogenomicsProteogenomics file format • ProBAM/ProBED
• IGV等ゲノミクス分野で作られているビューワーにプロテオームデータを表示させる
• 基本的にBAM/BEDの拡張 • ProVCFは難しそう?
Proteogenomics 解析パイプライン • ProteoAnnotator、他多数 • 解析対象が多様
• がんプロテオーム • 新規生物のアノテーション/アノテーションの高度化
• メタプロテオミクス
Licensed under CC-BY 4.0 ©2016 YOUR NAME(DBCLS)Licensed under CC-BY 4.0 ©2017 SHIN KAWANO (DBCLS/NBDC)
OmicsDI• Omics Discovery Index
• ゲノム/トランスクリプトーム/プロテオーム/メタボロームレポジトリからメタデータを収集 • オミクスDBをまたいで似たデータセットを見つける • RDF化
Genome EnsemblENA
Transcriptome ArrayExpressExpressionAtlas
Proteome GPMDBMassIVEPeptideAtlasPRIDE jPOST
Metabolome GNPSMetaboLightsMetabolomeExpressMetabolomics Workbench