開発者会議BioHackathon2016 DBCLS SPARQLthonの発展 · 2017-02-09 · DBCLS Database Center...

1
DBCLS Database Center for Life Science 片山 俊明(情報・システム研究機構 ライフサイエンス統合データベースセンター) 開発者会議BioHackathon2016SPARQLthonの発展 バイオサイエンスデータベースセンター(NBDC)とライフサイエンス統合データベースセンター(DBCLS)では、データベースの統合に 関わる最先端の技術開発を行う国際開発者会議BioHackathonを2008年から開催してきた。第9回目となる今年は、慶應義塾大学先 端生命科学研究所の協力のもと鶴岡市内で開催し、生命科学の根幹をなすゲノム情報と増大するオミックスデータの統合的な利用を実 現するため、セマンティック・ウェブによる最先端のデータベース技術開発を継続して行った。また、これらの技術を国内でも活用す るため、DBCLSでは毎月SPARQLthonという会議を開催しており、さまざまなデータベース開発者の技術交流を促進している。ここ では、BioHackathonとSPARQLthonにおける開発成果を概観し、DBCLSにおける関連サービスの開発状況について進展を報告す る。 国際版BioHackathon BioHackathon 2016 国内版バイオハッカソン SPARQLthon 第9回となるNBDC/DBCLS BioHackathonは、2016年6月12 日~18日にかけて、應義塾大学先端生命科学研究所のご協力に より、山形県鶴岡市で開催された。初日のシンポジウムでは15 件の講演と17件のライトニングトークが発表された。 今回は、新しい試みとしてBioHackathonで取り組みたい課題を 公募したところ23件の応募があり、オーガナイザーで協議した 結果、有用な提案3件を採択し招聘した。また、参加者がはじめ て100名を超える大規模なものとなったため、ハッカソン期間中 のラップアップを毎日ではなく水曜日と最終日だけに減らした。 開催地が隔離された地理的環境にあったことや24時間会場が使 えたこともあり、今回も多くのプロジェクトに進展が見られた。 国内版バイオハッカソンBH16.12 in 山口 参加者募集中! (2016121216) Licensed under CC-BY 4.0 © 2016 Toshiaki Katayama (DBCLS) ポスター番号 No.14 DB統合 なぜ必要? 何を対象? どう実現? どう見せる? 国際版のBioHackathonでは、分散環境への対応と高い相互運用 性をもつ次世代のデータベース統合に適した技術としてセマン ティック・ウェブに注目し、技術開発を進めてきた。 ここ数年で、EBI, NCBI, NBDCなどの主要センターから様々な RDFデータが提供されるようになってきたことをふまえ、その利 活用における課題解決や不十分な点の補完を進めている。 http://wiki.lifesciencedb.jp/mw/BH16.12 国際版のBioHackathonの成果をふまえ、データベース統合につ いての技術開発を支援・最新技術の情報共有・実務者間での交流 を促進するため、DBCLSでは国内版のバイオハッカソンも毎年 開催してきている。第7回目となる今年度は、12月に山口大学お よび山口情報芸術センターのご協力により、山口市で開催予定。 統合化推進プログラムと連携し、RDFとSPARQLを用いたデー タベースの構築および利用を推進するため、DBCLSでは毎月 SPARQLthonを開催してきた。2012年10月の第1回から2016 年9月の第48回までの間に、トリプルストアやRDFデータの取り 扱い方やチューニング方法を試行錯誤しつつ、NBDCのRDFポー タルに収録されることになるRDFやオントロジーの開発を進めて きたほか、その活用方法としてTogoStanzaや様々なSPARQLの 開発を行ってきた。 http://wiki.lifesciencedb.jp/mw/SPARQLthon 見える形での主な成果としては * NBDC RDF ポータルの立ち上げ * 日本初のSPARQL本を上梓 が挙げられるが、関係者が毎月一度、 定期的に顔を合わせることによっては じめて、統合化推進プログラムのRDF 開発と連携を実現できたことが、実質 的には一番の成果といえる。 なお、SPARQLにちなんで夜の部での スパークリングワインの開栓が恒例と なっている。 http://www.biohackathon.org/ BioHackMetrics BioHackathonを引用している論文をGoogle ScholarとEU PMC から検索するプログラムを作成し収集したところ、43のドキュ メントが見つかり、DOIがついていた31個についてMendeleyで リファレンス化 RDFソフトウェア開発 SPARQL検索を一般の研究者にも利用しやすくするSPARQLビ ルダーやLODQA, Crick-chanなどのシステム開発、RDFデータ ベース構築や運用を効率化するBioHDT, JETSPARQL, Noctua, D2RQ mapperなどの開発 Genomics GA4GHのゲノム変異グラフvgやCombなどアラインメントの開 発、稀少疾患やがんの遺伝型と表現型の情報をつなぐMMEの文 献情報・IRUD/J-RARE連携・秘匿検索技術などの開発、アノテー ションの集約を行うトラックハブのJSON-LDによる情報共有や Metaexplorerの開発、NGSに関連するポータルやトランスクリ プトームのデータ整備、J-PhenomeとMonarchの連携 Omics Glycomics、Epigenomics (iHEC)、Proteomics (jPOST)など のオミックスデータのRDF化や統合 RDF/LOD オープンデータのFAIRnessを測る指標の開発、SPARQLエンド ポイントの頑健性や有用性を測るYummyDataの開発、IDの統合 に必要なPrefixCommonsの開発、日本語版HPOやJSTシソーラ スや画像メタデータなどのオントロジー開発、EBIのOLSにおけ るオントロジーのマッピングサービス開発、Wikidataを集約的 なデータベースとしてPubChemやTogoGenomeと連携 新たな方向性 標準化されていない実験プロトコルの記述をセマンティック・ウェ ブで定義するためのソフトウェアやオントロジーを整備し、実験 や解析の再現性や正確性を高めて共有するための仕様策定、大量 に蓄積されてきたRDFデータを活用するための機械学習や人工知 能の技術応用 第10回 BioHackathon に向けて 来年度のBioHackathonは10周年を迎える。これまでの成果の集大成と今後 の方向性を考えるため、過去の参加者にできるだけ多く参集して頂き、総合的 なシンポジウムと、次世代につながるハッカソンのあり方を検討したい。

Transcript of 開発者会議BioHackathon2016 DBCLS SPARQLthonの発展 · 2017-02-09 · DBCLS Database Center...

Page 1: 開発者会議BioHackathon2016 DBCLS SPARQLthonの発展 · 2017-02-09 · DBCLS Database Center for Life Science 片山 俊明(情報・システム研究機構 ライフサイエンス統合データベースセンター)

DBCLSDatabase Center for Life Science

片山 俊明(情報・システム研究機構 ライフサイエンス統合データベースセンター)

開発者会議BioHackathon2016と SPARQLthonの発展

バイオサイエンスデータベースセンター(NBDC)とライフサイエンス統合データベースセンター(DBCLS)では、データベースの統合に関わる最先端の技術開発を行う国際開発者会議BioHackathonを2008年から開催してきた。第9回目となる今年は、慶應義塾大学先端生命科学研究所の協力のもと鶴岡市内で開催し、生命科学の根幹をなすゲノム情報と増大するオミックスデータの統合的な利用を実現するため、セマンティック・ウェブによる最先端のデータベース技術開発を継続して行った。また、これらの技術を国内でも活用するため、DBCLSでは毎月SPARQLthonという会議を開催しており、さまざまなデータベース開発者の技術交流を促進している。ここでは、BioHackathonとSPARQLthonにおける開発成果を概観し、DBCLSにおける関連サービスの開発状況について進展を報告する。

国際版BioHackathon

BioHackathon 2016

国内版バイオハッカソン

SPARQLthon

第9回となるNBDC/DBCLS BioHackathonは、2016年6月12日~18日にかけて、應義塾大学先端生命科学研究所のご協力により、山形県鶴岡市で開催された。初日のシンポジウムでは15件の講演と17件のライトニングトークが発表された。 今回は、新しい試みとしてBioHackathonで取り組みたい課題を公募したところ23件の応募があり、オーガナイザーで協議した結果、有用な提案3件を採択し招聘した。また、参加者がはじめて100名を超える大規模なものとなったため、ハッカソン期間中のラップアップを毎日ではなく水曜日と最終日だけに減らした。開催地が隔離された地理的環境にあったことや24時間会場が使えたこともあり、今回も多くのプロジェクトに進展が見られた。

国内版バイオハッカソンBH16.12 in 山口

参加者募集中! (2016年12月12~16日)

Licensed under CC-BY 4.0 © 2016 Toshiaki Katayama (DBCLS)

ポスター番号

No.14

DB統合

なぜ必要?

何を対象?

どう実現?

どう見せる?

国際版のBioHackathonでは、分散環境への対応と高い相互運用性をもつ次世代のデータベース統合に適した技術としてセマンティック・ウェブに注目し、技術開発を進めてきた。 ここ数年で、EBI, NCBI, NBDCなどの主要センターから様々なRDFデータが提供されるようになってきたことをふまえ、その利活用における課題解決や不十分な点の補完を進めている。

http://wiki.lifesciencedb.jp/mw/BH16.12

国際版のBioHackathonの成果をふまえ、データベース統合についての技術開発を支援・最新技術の情報共有・実務者間での交流を促進するため、DBCLSでは国内版のバイオハッカソンも毎年開催してきている。第7回目となる今年度は、12月に山口大学および山口情報芸術センターのご協力により、山口市で開催予定。

統合化推進プログラムと連携し、RDFとSPARQLを用いたデータベースの構築および利用を推進するため、DBCLSでは毎月SPARQLthonを開催してきた。2012年10月の第1回から2016年9月の第48回までの間に、トリプルストアやRDFデータの取り扱い方やチューニング方法を試行錯誤しつつ、NBDCのRDFポータルに収録されることになるRDFやオントロジーの開発を進めてきたほか、その活用方法としてTogoStanzaや様々なSPARQLの開発を行ってきた。

http://wiki.lifesciencedb.jp/mw/SPARQLthon

見える形での主な成果としては * NBDC RDF ポータルの立ち上げ * 日本初のSPARQL本を上梓 が挙げられるが、関係者が毎月一度、定期的に顔を合わせることによってはじめて、統合化推進プログラムのRDF開発と連携を実現できたことが、実質的には一番の成果といえる。 なお、SPARQLにちなんで夜の部でのスパークリングワインの開栓が恒例となっている。

http://www.biohackathon.org/

BioHackMetricsBioHackathonを引用している論文をGoogle ScholarとEU PMCから検索するプログラムを作成し収集したところ、43のドキュメントが見つかり、DOIがついていた31個についてMendeleyでリファレンス化RDFソフトウェア開発SPARQL検索を一般の研究者にも利用しやすくするSPARQLビルダーやLODQA, Crick-chanなどのシステム開発、RDFデータベース構築や運用を効率化するBioHDT, JETSPARQL, Noctua, D2RQ mapperなどの開発GenomicsGA4GHのゲノム変異グラフvgやCombなどアラインメントの開発、稀少疾患やがんの遺伝型と表現型の情報をつなぐMMEの文献情報・IRUD/J-RARE連携・秘匿検索技術などの開発、アノテーションの集約を行うトラックハブのJSON-LDによる情報共有やMetaexplorerの開発、NGSに関連するポータルやトランスクリプトームのデータ整備、J-PhenomeとMonarchの連携OmicsGlycomics、Epigenomics (iHEC)、Proteomics (jPOST)などのオミックスデータのRDF化や統合RDF/LODオープンデータのFAIRnessを測る指標の開発、SPARQLエンドポイントの頑健性や有用性を測るYummyDataの開発、IDの統合に必要なPrefixCommonsの開発、日本語版HPOやJSTシソーラスや画像メタデータなどのオントロジー開発、EBIのOLSにおけるオントロジーのマッピングサービス開発、Wikidataを集約的なデータベースとしてPubChemやTogoGenomeと連携新たな方向性標準化されていない実験プロトコルの記述をセマンティック・ウェブで定義するためのソフトウェアやオントロジーを整備し、実験や解析の再現性や正確性を高めて共有するための仕様策定、大量に蓄積されてきたRDFデータを活用するための機械学習や人工知能の技術応用

第10回 BioHackathon に向けて来年度のBioHackathonは10周年を迎える。これまでの成果の集大成と今後の方向性を考えるため、過去の参加者にできるだけ多く参集して頂き、総合的なシンポジウムと、次世代につながるハッカソンのあり方を検討したい。