学術資源リポジトリ協議会 第14回勉強会資料

41
学術資源リポジトリの これからについて考える 一橋大学 情報基盤センター 林 正治 学術資源リポジトリ協議会第14回勉強会資料 20150807 CC BY 4.0

Transcript of 学術資源リポジトリ協議会 第14回勉強会資料

Page 1: 学術資源リポジトリ協議会 第14回勉強会資料

学術資源リポジトリのこれからについて考える

一橋大学 情報基盤センター 林 正治

学術資源リポジトリ協議会第14回勉強会資料 20150807CC BY 4.0

Page 2: 学術資源リポジトリ協議会 第14回勉強会資料

公開リポジトリ

weko.repon.org

2014年12月頃スタート

Page 3: 学術資源リポジトリ協議会 第14回勉強会資料

アクセス状況

0

450

900

1350

1800

04/12 05/01 05/02 05/03 05/04 05/05 05/06 05/07

閲覧回数 アイテム数

wekoモジュール調べ

1227

1646

Page 4: 学術資源リポジトリ協議会 第14回勉強会資料

本日の内容

• DOI(Digital Object Identifier)について

• 公開リポジトリの分割(サブジェクトリポジトリ化)

• データリポジトリにおけるバージョン管理事例

Page 5: 学術資源リポジトリ協議会 第14回勉強会資料

Permalink : http://id.nii.ac.jp/1314/00000472/

http://weko.repon.org/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=472&item_no=1&page_id=13&block_i

d=11

ネジマイクロメーター

DOI(Digital Object Identifier)?

Page 6: 学術資源リポジトリ協議会 第14回勉強会資料

なぜDOIがいるのか?

Page 7: 学術資源リポジトリ協議会 第14回勉強会資料

URIではだめなのか?

URI(Uniform Resource Identifier)

URL(Uniform Resource Locator)

http://dl.ndl.go.jp/info:ndljp/pid/2586670https://tools.ietf.org/html/rfc3986

https://ipsj.ixsq.nii.ac.jp/ej/

URN(Uniform Resource Name)

info:ndljp/pid/2586670urn:ietf:rfc:3986

urn:issn:1882-7764

*Cool URIs don't change, http://www.w3.org/Provider/Style/URI.html

リソースの場所とアクセス方法から構成される。場所移動となったらURLは変わる。

CoolなURIは変わらない* だけど、Coolじゃないのが多いからURIは変わることがある

リソースの名前。慣習的に永続性が求められてきた。

Page 8: 学術資源リポジトリ協議会 第14回勉強会資料

URLではなく 永続的な名前で管理しよう

Page 9: 学術資源リポジトリ協議会 第14回勉強会資料

Handle System® • インターネットリソースに対して永続的識別子を提供するシステムの一つ。インターネットリソースへの到達可能性を確保することを目的としている。URLに対して永続的で一意な識別子(ハンドル)を割り当て、URL変更時にはハンドルの割当先を変更することで対応する。

• ハンドルの構文

• Handle-Prefix/Handle-Suffix

• ハンドルの照会

• http://hdl.handle.net + ハンドル

• http://hdl.handle.net/4263537/5555

Page 10: 学術資源リポジトリ協議会 第14回勉強会資料

ハンドルの割り当て

Global Handle Registry ®(GHR)

Local Handle Service (LHS)

Local Repository

2. プレフィックス割り当て「4263537」

1.プレフィックス取得(初回のみ)

4.ハンドル取得

5. サフィックス割り当て「5555」

6. ハンドル割り当て「4263537/5555」

3.コンテンツ登録「http://www.handle.net/」

Page 11: 学術資源リポジトリ協議会 第14回勉強会資料

ハンドルの解決Global Handle

Registry ®(GHR)Local Handle Service (LHS)

1. ハンドル照会要求「http://hdl.handle.net/

4263537/5555」

Local RepositoryWeb Browser

5. コンテンツ要求「http://www.handle.net/」

3. URL回答「http://www.handle.net/」

2. ハンドル照会要求「4263537/5555」

4. リダイレクト指示

6. コンテンツ提供

Page 12: 学術資源リポジトリ協議会 第14回勉強会資料

Handle Systemは 一機関でGHRを管理、継続性が心配

到達可能性や一貫性の維持はLHSの運用次第 もう少し、しっかりできないか…

Page 13: 学術資源リポジトリ協議会 第14回勉強会資料

DOI®(Digital Object Identifier) System

• デジタルオブジェクトの識別子(DOI name)を維持管理する仕組み(ISO 26324)

• Handle System® + データモデル + 運用ポリシー + 組織運営による永続性、持続性、一貫性の維持

• IDF(International DOI Foundation)が統括、DOI 割り当て業務をRA(Registration Agencies)が担当

Page 14: 学術資源リポジトリ協議会 第14回勉強会資料

DOI nameと名前解決• DOI name

• DOI-Prefix/DOI-Suffix

• 10.1000/182

• Resolver

• http://dx.doi.org/[DOI name]

• http://dx.doi.org/10.1000/182

Page 15: 学術資源リポジトリ協議会 第14回勉強会資料

DOI名前解決の流れ

http://dx.doi.org/10.1000/182

10.1000/182

http://www.doi.org/hb.html

303 See Other

GET

Page 16: 学術資源リポジトリ協議会 第14回勉強会資料

Multiple resolution

http://dx.doi.org/10.1525/bio.2009.59.5.9

http://mr.crossref.org/iPage?doi=10.1525%2Fbio.2009.59.5.9

http://www.jstor.org/stable/25502450

http://www.bioone.org/doi/full/10.1525/bio.2009.59.5.9

303 See Other

一つのDOIに対して複数のURLを提示する仕組み

Page 17: 学術資源リポジトリ協議会 第14回勉強会資料

Reponでの DOI利用イメージ

Page 18: 学術資源リポジトリ協議会 第14回勉強会資料

麻布大学学術情報リポジトリazabook https://az.repo.nii.ac.jp

Page 19: 学術資源リポジトリ協議会 第14回勉強会資料

Permalink : http://id.nii.ac.jp/1112/00002961/

麻布大学学術情報リポジトリazabook https://az.repo.nii.ac.jp

貴重資料>古典籍 馬医醍醐初之第一~第四

Page 20: 学術資源リポジトリ協議会 第14回勉強会資料

DOI割り当ての流れ

DOIPrefix/Suffix

DOIPrefix/Suffix

IRDB(JAIRO)DOI

Prefix/Suffix

JaLCDOI

Prefix/Suffix

CrossRef

NII JaLC準会員 NII JaLC CrossRef

IDF

juni2メタデータハーベスト

メタデータハーベスト

DOI/URLPrefixで

JaLC DOICrossRef DOIを判別?

NiiType等を確認しDOI登録可否を判別

selfDOIに自機関発行のDOIを登録

ref. http://www.nii.ac.jp/irp/archive/system/pdf/JaLC_guideline_ver2.0.pdf

Page 21: 学術資源リポジトリ協議会 第14回勉強会資料

DOI利用に向けた手順• 公開リポジトリ(weko.repon.org)の分割

• サブジェクトリポジトリのFQDN決定

• 国立情報学研究所が取り纏めるJaLC準会員の申請

• http://www.nii.ac.jp/irp/archive/system/jalc

• IRDBハーベスティング対応メタデータ整備(マッピング)

• http://www.nii.ac.jp/irp/archive/system/jalc

• Landing Pageの検討(引用方法について)

Page 22: 学術資源リポジトリ協議会 第14回勉強会資料

Landing Page Best Practice by Data Cite

• Landing Pageにあるべき情報

• データの引用情報

• データへのリンク、利用規約・制限事項

• データに関連するメタデータ

• データ使用にあたっての技術的情報(ソフトウェア、データ構造等)

• Landing Pageが用意できない場合は、そもそもDOIを割り当てるべき粒度かどうかを検討すべき。

• Landing Pageは、いかなる形式のデータ、データのアクセスに制限があったとしても、だれでもいつでもアクセスできる状況になければならない。

• Langing Pageのすべてのリンクは常に最新の状態で有効でなければならない。

DataCite Business Models Principles v 1.0, http://dx.doi.org/doi:10.5438/0007

Page 23: 学術資源リポジトリ協議会 第14回勉強会資料

公開リポジトリの分割 (サブジェクトリポジトリ化)

• 教育掛図資料

• 石川県立自然史資料館所蔵

• 大阪教育大学附属図書館所蔵

• 奈良女子大学附属図書館「明治教育文庫」

• 科学実験機器資料

• 新潟大学所蔵

• 神戸大学所蔵

• 東京大学駒場博物館所蔵

• 石川県立自然史資料館所蔵

• 大阪教育大学附属図書館所蔵

???.repon.org

???.repon.org

Page 24: 学術資源リポジトリ協議会 第14回勉強会資料

公開リポジトリの 勝手位置付け

• 研究データ提供のためのリポジトリ

• 金沢大学資料館資料アーカイブ、http://kuvm.kanazawa-u.ac.jp/

• 国会図書館デジタルコレクション, http://dl.ndl.go.jp/

• Akebono VLF/MCA Data Repository, https://akebono-vlf.db.kanazawa-u.ac.jp/

• IUGONET, http://www.iugonet.org/

• 研究成果共有のためのリポジトリ

• 機関リポジトリ

• Dryad(http://datadryad.org/)

• figshare (http://figshare.com/)

Page 25: 学術資源リポジトリ協議会 第14回勉強会資料

サブジェクトリポジトリ FQDN(案)

• 博物館資料(コレクション):mus.materials.repon.org

• 教育掛図資料:edu.materials

• 科学実験機器:lab.materials, labware

• アーカイブス:archives.repon.org

• 学園史関係: historicalmaterials、archives

• (その他:data.repon.org)

• →weko.repon.orgは廃止

Page 26: 学術資源リポジトリ協議会 第14回勉強会資料

データリポジトリにおける バージョン管理事例

Page 27: 学術資源リポジトリ協議会 第14回勉強会資料

Dryad http://datadryad.org/

Page 28: 学術資源リポジトリ協議会 第14回勉強会資料
Page 29: 学術資源リポジトリ協議会 第14回勉強会資料

Dryad:DOI Usage

dryad. [DataPackage]

dryad. [DataPackage].[Version]

dryad. [DataPackage]/[DataFile]

dryad. [DataPackage]/[DataFile].[Version]

10.5061/

dryad. [DataPackage].[Version]/[DataFile].[Version]

Prefix

Suffix

Page 30: 学術資源リポジトリ協議会 第14回勉強会資料

Data Package

Data File 3

Data File 2

Data File 1dryad.3bp51

dryad.3bp51.1

dryad.3bp51.2

dryad.3bp51/1

dryad.3bp51.2/1.2

dryad.3bp51/3

dryad.3bp51.1/3.1

dryad.3bp51.2/3.2

dryad.3bp51/4

dryad.3bp51.1/4.1

dryad.3bp51.2/4.2

current

current

current

current

http://dx.doi.org/10.5061/dryad.3bp51.2

Page 31: 学術資源リポジトリ協議会 第14回勉強会資料

Title

Files in this package

Citing Information

Metadata

*Version History

Title

Citing Information

Metadata

File

*Version History

Data Package

Data File

Page 32: 学術資源リポジトリ協議会 第14回勉強会資料

figshare http://figshare.com/

Page 33: 学術資源リポジトリ協議会 第14回勉強会資料

Description

Title

Data Files

Citing Information

Description

• http://dx.doi.org/10.6084/m9.figshare.1186832

figshare http://figshare.com/

Page 34: 学術資源リポジトリ協議会 第14回勉強会資料

Data Files

http://figshare.com/articles/Journal_subscription_costs_FOIs_to_UK_universities/1186832/22

バージョン毎のlanding pageを用意 DOIは最新版のみ

Page 35: 学術資源リポジトリ協議会 第14回勉強会資料

DataCite https://www.datacite.org/

Page 36: 学術資源リポジトリ協議会 第14回勉強会資料

DataCite Metadata Schema 3.1 版管理関係のみ抜粋

• RelatedIdentifier(recommended)

• relatedIdentifierType

• DOI, ISBN, ISSN, URL, URN, etc.

• relationType

• IsNewVersionOf, IsPreviousVersionOf, IsOriginalFormOf

• Version(optional)

ref. http://dx.doi.org/doi:10.5438/0010

Page 37: 学術資源リポジトリ協議会 第14回勉強会資料

DataCite Metadata Schema v.3.1のメタデータ

• <oai_datacite xsi:schemaLocation="http://schema.datacite.org/oai/oai-1.0/ http://schema.datacite.org/oai/oai-1.0/oai.xsd" > • ~省略~ • <payload>

• <resource xsi:schemaLocation="http://datacite.org/schema/kernel-3 http://schema.datacite.org/meta/kernel-3/metadata.xsd" > • <identifier identifierType="DOI" >10.5438/0011</identifier> • <creators>

• <creator> • <creatorName>DataCite Metadata Working Group</creatorName>

• </creator> • </creators> • <titles>

• <title>DataCite Metadata Schema for the Publication and Citation of Research Data v3.1</title> • <title titleType="Subtitle" >XSD</title>

• </titles> • <publisher>DataCite e.V.</publisher> • <publicationYear>2014</publicationYear> • ~省略~ • <relatedIdentifiers>

• <relatedIdentifier relatedIdentifierType="DOI" relationType="IsDocumentedBy" >10.5438/0010</relatedIdentifier> • <relatedIdentifier relatedIdentifierType="DOI" relationType="IsNewVersionOf" >10.5438/0009</relatedIdentifier>

• </relatedIdentifiers> • <version>3.1</version>

• </resource> • </payload>

• </oai_datacite>

ref. http://oai.datacite.org/oai?verb=ListRecords&metadataPrefix=oai_datacite&set=~P3E9ZG9pJTNBMTAuNTQzOCUyRjAwMTE

Page 38: 学術資源リポジトリ協議会 第14回勉強会資料

データリポジトリにおける バージョン管理

• dryad • data packageおよびdata file 単位でlanding pageを用意 • バージョン毎にlanding pageが存在 • バージョンのすべてにDOIを付与(DOI構文にバージョンの概念を組み込んでいる)

• figshare • data set単位でlanding pageを用意 • バージョン毎にlanding pageが存在 • 最新のlanding pageのみDOIを付与

• Data Citeスキーマ • メタデータスキーマで必要に応じてバージョンの前後関係を記述

バージョン毎のDOI付与よりも、 landing pageで過去バージョンを示すのが現実的か

Page 39: 学術資源リポジトリ協議会 第14回勉強会資料

議論

Page 40: 学術資源リポジトリ協議会 第14回勉強会資料

DOI利用に向けた手順• 公開リポジトリ(weko.repon.org)の分割

• サブジェクトリポジトリのFQDN決定

• 国立情報学研究所が取り纏めるJaLC準会員の申請

• http://www.nii.ac.jp/irp/archive/system/jalc

• IRDBハーベスティング対応メタデータ整備(マッピング)

• http://www.nii.ac.jp/irp/archive/system/jalc

• Landing Pageの検討(引用方法について)

Page 41: 学術資源リポジトリ協議会 第14回勉強会資料

サブジェクトリポジトリ FQDN(案)

• 博物館資料(コレクション):mus.materials.repon.org

• 教育掛図資料:edu.materials

• 科学実験機器:lab.materials, labware

• アーカイブス:archives.repon.org

• 学園史関係: historicalmaterials、archives

• (その他:data.repon.org)

• →weko.repon.orgは廃止