生命科学データベース統合に関する調査研究 ·...

4
-- 生命科学データベース統合に関する調査研究 者:大久保 公策(大学共同利用機関法人情 報・システム研究機構国立遺伝学研究所 生命情報・DDBJ 研究センター) 関:大学共同利用機関法人 情報・システム 研究機構 I. 研究の全体計画 1. 研究の趣旨 大規模解析系を用いたプロジェクト型研究では,その成 果はデータベース(以下,DB)として保存され,また多 様化や細分化を重ねた生命科学の知的集積物は,膨大化の 一途を辿っている。これらの散在するデータや集積物は一 望困難で有機的結合に乏しく,個々の研究者による利用は 必ずしも容易ではないため,十分に利用されているとは言 えない。そのため,我が国の知的情報基盤の設計に資する 客観的な資料並びに国内主要 DB の統合化に関するフィー ジビリティースタディを通じた実現性検証結果の提示及 び,それらの成果を活かした制度設計やロードマップ作成 に資する試案の作成が,極めて重要で緊急を要する課題と なっている。 本研究は,関係府省における DB の統合化に向けた取り 組みの補完的な研究として,単独府省で対処することが困 難な関係府省傘下の研究機関等に散在している統合化の対 象となりうる DB について,総合的な推進体制で,関係府 省の枠組みを超えて国内主要 DB の構築機関が連携し実施 するものである。 実施内容としては,DB の構築経験者及び典型的利用者 に対し,生命科学において重要度の高い DB の内容,用途・ 維持管理方法に関する調査を行い,主要 DB を,構成デー タに分解し,個々の DB の内容及び相互の関係が統一的な 表現方法で一覧できるような表現方法を開発し,それぞれ の DB の特徴を一望する。また,複数の DB 機能を統合す る際の技術的制度的問題点の検討を目的に,少数の DB の 試験的な統合を行なう。 その成果として,関係府省における DB 統合化に向けた 取り組みの補完となる関係府省の制度設計や,ロードマッ プ作成に資する試案の提示,複数の国内主要 DB を統合化 する際の技術的課題及び解決策の提示,フィジビリティー スタディを通じた実現性検証結果,維持可能性検証結果, 国内外の医学分野・学術分野 DB,国内の産業分野 DB に 関する技術的側面,制度的側面からの基礎調査結果の提示 を行う。 2. 研究の概要 a. 基礎生命科学のデータベース統合にかかわる調査研究 我が国のライフサイエンス分野における知的情報基盤の 設計に資する当該分野の情報資源についての国内海外の状 況についての客観的な資料を提示する。また国内主要デー タベースを中心として統合化に関するフィジビリティース タディを通じた実現性検証結果の提示及を行う。さらにこ れらの成果を活かした統合データベースの機能や制度につ いての試案を作成し,実現に向けたロードマップ作成に資 する試案を作成する。 () 生命科学一般のデータベース統合にかかわる調査研究 基礎生命科学分野の観点からデータベース統合化のため の調査を行う。基礎生命科学分野における遺伝子・蛋白 質・遺伝子発現・文献などの国内主要データベースについ て調査を行い,その結果に基づき試験的統合の対象を決定 し,統合の技術的な検討を続け実際の統合を開始し,技術 的問題及び維持管理上の問題を探る。 (2) 基礎生命科学のデータベース統合にかかわる調査研究 ライフサイエンスデータベースを統合する際の課題を, ハードウエアおよびネットワーク周辺の物理的レベルから 考察する。つづいてユーザーとの窓口である問合せ言語 のレベルからも考察する。そして限りある計算資源を最大 限に活かして,ライフサイエンス研究者の満足度を充足さ せるための統合化の道筋を提示する。この提示の実現可能 性を検証するために,現実にプロトタイプを作成し,web より公開し,フィードバックを得ることを目指す。 b. 医学データベース統合に関する調査研究 本サブテーマでは,全実施期間を通して,研究運営委員 会下部に必要に応じて設置される,データベースの用途に 応じた検討班(医学分野データベース検討班・学術分野 データベース検討班,産業分野データベース検討班等を想 定)において他のサブテーマ研究者と連携して関係府省の 制度設計やロードマップ作成に資する試案を検討する。さ らに医学分野において,優先的に統合に取り組むべきデー タベース便覧の作成及び,試験的統合に際しての方針の策 定,助言等を行う。これら検討にあたっては,幅広い知見 を集約するために以下の研究者に協力を仰ぐ。 ・田中 敏博:(独)理化学研究所心筋梗塞関連遺伝 子研究チーム チームリーダー ・後藤 順:東京大学 大学院脳神経医学専攻神経内 科学 講師 ・祖父江 友孝:国立がんセンター がん予防・検診 研究センター情報研究部 部長

Transcript of 生命科学データベース統合に関する調査研究 ·...

Page 1: 生命科学データベース統合に関する調査研究 · 生命科学データベース統合に関する調査研究 代 表 者:大久保 公策(大学共同利用機関法人情

- � -

生命科学データベース統合に関する調査研究

代 表 者:大久保 公策(大学共同利用機関法人情

報・システム研究機構国立遺伝学研究所

生命情報・DDBJ 研究センター)

責 任 機 関:大学共同利用機関法人 情報・システム

研究機構

I. 研究の全体計画

1. 研究の趣旨

大規模解析系を用いたプロジェクト型研究では,その成

果はデータベース(以下,DB)として保存され,また多

様化や細分化を重ねた生命科学の知的集積物は,膨大化の

一途を辿っている。これらの散在するデータや集積物は一

望困難で有機的結合に乏しく,個々の研究者による利用は

必ずしも容易ではないため,十分に利用されているとは言

えない。そのため,我が国の知的情報基盤の設計に資する

客観的な資料並びに国内主要 DB の統合化に関するフィー

ジビリティースタディを通じた実現性検証結果の提示及

び,それらの成果を活かした制度設計やロードマップ作成

に資する試案の作成が,極めて重要で緊急を要する課題と

なっている。

本研究は,関係府省における DB の統合化に向けた取り

組みの補完的な研究として,単独府省で対処することが困

難な関係府省傘下の研究機関等に散在している統合化の対

象となりうる DB について,総合的な推進体制で,関係府

省の枠組みを超えて国内主要 DB の構築機関が連携し実施

するものである。

実施内容としては,DB の構築経験者及び典型的利用者

に対し,生命科学において重要度の高い DB の内容,用途・

維持管理方法に関する調査を行い,主要 DB を,構成デー

タに分解し,個々の DB の内容及び相互の関係が統一的な

表現方法で一覧できるような表現方法を開発し,それぞれ

の DB の特徴を一望する。また,複数の DB 機能を統合す

る際の技術的制度的問題点の検討を目的に,少数の DB の

試験的な統合を行なう。

その成果として,関係府省における DB 統合化に向けた

取り組みの補完となる関係府省の制度設計や,ロードマッ

プ作成に資する試案の提示,複数の国内主要 DB を統合化

する際の技術的課題及び解決策の提示,フィジビリティー

スタディを通じた実現性検証結果,維持可能性検証結果,

国内外の医学分野・学術分野 DB,国内の産業分野 DB に

関する技術的側面,制度的側面からの基礎調査結果の提示

を行う。

2. 研究の概要

a. 基礎生命科学のデータベース統合にかかわる調査研究

我が国のライフサイエンス分野における知的情報基盤の

設計に資する当該分野の情報資源についての国内海外の状

況についての客観的な資料を提示する。また国内主要デー

タベースを中心として統合化に関するフィジビリティース

タディを通じた実現性検証結果の提示及を行う。さらにこ

れらの成果を活かした統合データベースの機能や制度につ

いての試案を作成し,実現に向けたロードマップ作成に資

する試案を作成する。

(�) 生命科学一般のデータベース統合にかかわる調査研究

基礎生命科学分野の観点からデータベース統合化のため

の調査を行う。基礎生命科学分野における遺伝子・蛋白

質・遺伝子発現・文献などの国内主要データベースについ

て調査を行い,その結果に基づき試験的統合の対象を決定

し,統合の技術的な検討を続け実際の統合を開始し,技術

的問題及び維持管理上の問題を探る。

(2) 基礎生命科学のデータベース統合にかかわる調査研究

ライフサイエンスデータベースを統合する際の課題を,

ハードウエアおよびネットワーク周辺の物理的レベルから

考察する。つづいてユーザーとの窓口である問合せ言語

のレベルからも考察する。そして限りある計算資源を最大

限に活かして,ライフサイエンス研究者の満足度を充足さ

せるための統合化の道筋を提示する。この提示の実現可能

性を検証するために,現実にプロトタイプを作成し,web

より公開し,フィードバックを得ることを目指す。

b. 医学データベース統合に関する調査研究

本サブテーマでは,全実施期間を通して,研究運営委員

会下部に必要に応じて設置される,データベースの用途に

応じた検討班(医学分野データベース検討班・学術分野

データベース検討班,産業分野データベース検討班等を想

定)において他のサブテーマ研究者と連携して関係府省の

制度設計やロードマップ作成に資する試案を検討する。さ

らに医学分野において,優先的に統合に取り組むべきデー

タベース便覧の作成及び,試験的統合に際しての方針の策

定,助言等を行う。これら検討にあたっては,幅広い知見

を集約するために以下の研究者に協力を仰ぐ。

・田中 敏博:(独)理化学研究所心筋梗塞関連遺伝

子研究チーム チームリーダー

・後藤 順:東京大学 大学院脳神経医学専攻神経内

科学 講師

・祖父江 友孝:国立がんセンター がん予防・検診

研究センター情報研究部 部長

Page 2: 生命科学データベース統合に関する調査研究 · 生命科学データベース統合に関する調査研究 代 表 者:大久保 公策(大学共同利用機関法人情

- 2 -

医学領域全体を鳥瞰すると,基礎医学から臨床医学,疫

学・公衆衛生に至る極めて広い分野が存在し,そのそれぞ

れのデータベースも極めて多種多様であり,かつ膨大であ

る。さらに,診断基準やオントロジーの国内外の不統一,

標準化・デジタル化が困難または不可能なデータ,組み合

わせにより個人が特定できる情報,個別の競争的研究資金

に基づいて構築されるデータベースが多いなど,医学領域

に特徴的な課題が多い。そこで研究の初期段階として,ま

ずは上記研究協力者との討議を重ね,医学領域のデータ

ベースの,おおづかみなカテゴリー分類を行うとともに,

医学の進歩において必要とされているデータベースを把握

する。ついで,既存のデータベースを統合する意義に乏し

いと考えられるデータベースと,逆にその意義が高いと考

えられるデータベースとを,それぞれ同定する。また,既

に統合や標準化の努力がなされているデータベース及び関

連する事業を抽出し,次の段階としての訪問調査の計画を

立てる。特に,ポストヒトゲノムシークエンス時代に急速

に展開しつつある疾患ゲノム研究に注目し,共通言語とし

てのゲノム情報を軸にしたデータベースの試験的統合に関

して,他のサブテーマ研究者との連携作業を行う。

c. 産業(農林水産業)データベースの統合にかかわる調査研

農林水産省所管の研究機関が研究対象とする生物種は,

微生物,植物(作物,果樹,林木等),動物,昆虫,さら

には水産生物まで広範囲に及び,多種多様である。また,

ゲノム研究が最も進展しているイネにおいては全ゲノム解

読が終了しており,ゲノム配列情報 DB や関連 DB が構築

されているが,他の生物種では生物種毎に研究進捗段階も

異なっている。さらに,作成されているデータベースは,

一望困難であり,また有機的な連携が少ないため利便性が

高いとは言えない。従って,平成 �7 年度は農林水産省所

管の研究機関が公開している複数の主要データベースにつ

いて事前調査を実施し,調査項目を検討し,データベース

調査のためのシステムを作成する。本調査システムによ

り,農林水産省傘下の研究機関における主要なデータベー

スの構造・機能,利用法及び維持運営方法等の情報収集

を開始する。収集したデータベース情報を詳細に調査・分

析し,データベース便覧の作成を開始する。またそれら分

析結果を元に我が国の知的情報基盤の設計に資するための

客観的な資料を作成するとともに,それに基づいた知的情

報基盤の試案作成に取り組む。平成 �8 年度は,農林水産

省所管の研究機関が公開しているデータベースの網羅的調

査及び収集したデータベース情報の分析・精査及び取りま

とめを実施し,調査・分析した情報を基にデータベース便

覧の作成を行なう。収集したデータベースの種類,情報か

ら主要データベースを選択し,試験的統合データベースに

よるフィジビリティスタディを行ない,試験的統合データ

ベース構築に関わる手法,運用等の問題点を抽出し,今後

のデータベース統合化に資する。平成 �9 年度は,試験的

統合化データベースの運用を行ないつつ,問題点を抽出す

る。研究期間全体において,関係府省にまたがった知的情

報資源を一元集約的または機能的に統合を念頭におき,恒

久的に維持可能なデータベース運営方法のあり方を検討す

る。また,研究運営委員会下部に必要に応じて設置される,

データベースの用途に応じた検討班(医学分野データベー

ス検討班,学術分野データベース検討班,産業分野データ

ベース検討班等)において,他のサブテーマ研究者と連携

して,データベース便覧の作成,試験的統合への方針の策

定を行う。

d. 産業(農林水産業以外)データベースの統合にかかわる調

査研究

経済産業省傘下の研究機関にて,構築されたライフサイ

エンス分野のデータベースを中心に基礎調査を実施する。

また,研究運営委員会下部に必要に応じて設置される,

データベースの用途に応じた検討班(医学分野データベー

ス検討班,学術分野データベース検討班,産業分野データ

ベース検討班等を想定)において,他のサブテーマ研究者

と連携して,データベース便覧の作成,試験的統合への方

針の策定を行う。さらに,統合データベース作成に関する,

関係府省の制度設計やロードマップ作成に資する試案を検

討する。

Page 3: 生命科学データベース統合に関する調査研究 · 生命科学データベース統合に関する調査研究 代 表 者:大久保 公策(大学共同利用機関法人情

- � -

3. 年次計画

II. 平成 �7 年度における実施体制

III. 研究運営委員会

Page 4: 生命科学データベース統合に関する調査研究 · 生命科学データベース統合に関する調査研究 代 表 者:大久保 公策(大学共同利用機関法人情

- � -

IV. ミッションステートメント(具体的な達成目標)

関係府省におけるデータベース統合化に向けた取り組み

の補完となる関係府省の制度設計やロードマップ作成に

資する試案の提示。複数の国内主要データベースを統合化

する際の技術的課題並びに解決策の提示及びフィジビリ

ティースタディを通じた実現性検証結果の提示。国内外の

医学分野・学術分野データベース,国内の産業分野データ

ベースに関する技術的側面,制度的側面からの基礎調査結

果の提示。

V. 年次目標

1. 研究開始初年度の目標

主要なデータベースの構造・機能,利用法,維持運営法

の調査開始。

現状を速やかに是正するために,我が国の知的情報基盤

の設計に資するための客観的な資料及びそれに基づいた知

的情報基盤の試案を作成する。

2. 研究開始 2 年度目の目標

データベース構造・機能,利用法,維持運営法の網羅的

な収集および分類開始。

データベースおよび利用法の要素へ還元と便覧データ

ベース化開始。

試験的統合によるフィジビリティスタディの開始。

3. 研究開始 3 年度目の目標

データベース構造・機能,利用法,維持運営法の網羅的

な収集および分類終了。

データベースおよび利用法の要素へ還元と便覧データ

ベース化終了。

試験的統合データベースの運用と問題点の解析。

統合データベースの制度設計に資する試案の提示。

統合データベースへのロードマップの提示。