学術資源リポジトリのこれからについて考える
一橋大学 情報基盤センター 林 正治
学術資源リポジトリ協議会第14回勉強会資料 20150807CC BY 4.0
公開リポジトリ
weko.repon.org
2014年12月頃スタート
アクセス状況
0
450
900
1350
1800
04/12 05/01 05/02 05/03 05/04 05/05 05/06 05/07
閲覧回数 アイテム数
wekoモジュール調べ
1227
1646
本日の内容
• DOI(Digital Object Identifier)について
• 公開リポジトリの分割(サブジェクトリポジトリ化)
• データリポジトリにおけるバージョン管理事例
Permalink : http://id.nii.ac.jp/1314/00000472/
http://weko.repon.org/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=472&item_no=1&page_id=13&block_i
d=11
ネジマイクロメーター
DOI(Digital Object Identifier)?
なぜDOIがいるのか?
URIではだめなのか?
URI(Uniform Resource Identifier)
URL(Uniform Resource Locator)
http://dl.ndl.go.jp/info:ndljp/pid/2586670https://tools.ietf.org/html/rfc3986
https://ipsj.ixsq.nii.ac.jp/ej/
URN(Uniform Resource Name)
info:ndljp/pid/2586670urn:ietf:rfc:3986
urn:issn:1882-7764
*Cool URIs don't change, http://www.w3.org/Provider/Style/URI.html
リソースの場所とアクセス方法から構成される。場所移動となったらURLは変わる。
CoolなURIは変わらない* だけど、Coolじゃないのが多いからURIは変わることがある
リソースの名前。慣習的に永続性が求められてきた。
URLではなく 永続的な名前で管理しよう
Handle System® • インターネットリソースに対して永続的識別子を提供するシステムの一つ。インターネットリソースへの到達可能性を確保することを目的としている。URLに対して永続的で一意な識別子(ハンドル)を割り当て、URL変更時にはハンドルの割当先を変更することで対応する。
• ハンドルの構文
• Handle-Prefix/Handle-Suffix
• ハンドルの照会
• http://hdl.handle.net + ハンドル
• http://hdl.handle.net/4263537/5555
ハンドルの割り当て
Global Handle Registry ®(GHR)
Local Handle Service (LHS)
Local Repository
2. プレフィックス割り当て「4263537」
1.プレフィックス取得(初回のみ)
4.ハンドル取得
5. サフィックス割り当て「5555」
6. ハンドル割り当て「4263537/5555」
3.コンテンツ登録「http://www.handle.net/」
ハンドルの解決Global Handle
Registry ®(GHR)Local Handle Service (LHS)
1. ハンドル照会要求「http://hdl.handle.net/
4263537/5555」
Local RepositoryWeb Browser
5. コンテンツ要求「http://www.handle.net/」
3. URL回答「http://www.handle.net/」
2. ハンドル照会要求「4263537/5555」
4. リダイレクト指示
6. コンテンツ提供
Handle Systemは 一機関でGHRを管理、継続性が心配
到達可能性や一貫性の維持はLHSの運用次第 もう少し、しっかりできないか…
DOI®(Digital Object Identifier) System
• デジタルオブジェクトの識別子(DOI name)を維持管理する仕組み(ISO 26324)
• Handle System® + データモデル + 運用ポリシー + 組織運営による永続性、持続性、一貫性の維持
• IDF(International DOI Foundation)が統括、DOI 割り当て業務をRA(Registration Agencies)が担当
DOI nameと名前解決• DOI name
• DOI-Prefix/DOI-Suffix
• 10.1000/182
• Resolver
• http://dx.doi.org/[DOI name]
• http://dx.doi.org/10.1000/182
DOI名前解決の流れ
http://dx.doi.org/10.1000/182
10.1000/182
http://www.doi.org/hb.html
303 See Other
GET
Multiple resolution
http://dx.doi.org/10.1525/bio.2009.59.5.9
http://mr.crossref.org/iPage?doi=10.1525%2Fbio.2009.59.5.9
http://www.jstor.org/stable/25502450
http://www.bioone.org/doi/full/10.1525/bio.2009.59.5.9
303 See Other
一つのDOIに対して複数のURLを提示する仕組み
Reponでの DOI利用イメージ
麻布大学学術情報リポジトリazabook https://az.repo.nii.ac.jp
Permalink : http://id.nii.ac.jp/1112/00002961/
麻布大学学術情報リポジトリazabook https://az.repo.nii.ac.jp
貴重資料>古典籍 馬医醍醐初之第一~第四
DOI割り当ての流れ
DOIPrefix/Suffix
DOIPrefix/Suffix
IRDB(JAIRO)DOI
Prefix/Suffix
JaLCDOI
Prefix/Suffix
CrossRef
NII JaLC準会員 NII JaLC CrossRef
IDF
juni2メタデータハーベスト
メタデータハーベスト
DOI/URLPrefixで
JaLC DOICrossRef DOIを判別?
NiiType等を確認しDOI登録可否を判別
selfDOIに自機関発行のDOIを登録
ref. http://www.nii.ac.jp/irp/archive/system/pdf/JaLC_guideline_ver2.0.pdf
DOI利用に向けた手順• 公開リポジトリ(weko.repon.org)の分割
• サブジェクトリポジトリのFQDN決定
• 国立情報学研究所が取り纏めるJaLC準会員の申請
• http://www.nii.ac.jp/irp/archive/system/jalc
• IRDBハーベスティング対応メタデータ整備(マッピング)
• http://www.nii.ac.jp/irp/archive/system/jalc
• Landing Pageの検討(引用方法について)
Landing Page Best Practice by Data Cite
• Landing Pageにあるべき情報
• データの引用情報
• データへのリンク、利用規約・制限事項
• データに関連するメタデータ
• データ使用にあたっての技術的情報(ソフトウェア、データ構造等)
• Landing Pageが用意できない場合は、そもそもDOIを割り当てるべき粒度かどうかを検討すべき。
• Landing Pageは、いかなる形式のデータ、データのアクセスに制限があったとしても、だれでもいつでもアクセスできる状況になければならない。
• Langing Pageのすべてのリンクは常に最新の状態で有効でなければならない。
DataCite Business Models Principles v 1.0, http://dx.doi.org/doi:10.5438/0007
公開リポジトリの分割 (サブジェクトリポジトリ化)
• 教育掛図資料
• 石川県立自然史資料館所蔵
• 大阪教育大学附属図書館所蔵
• 奈良女子大学附属図書館「明治教育文庫」
• 科学実験機器資料
• 新潟大学所蔵
• 神戸大学所蔵
• 東京大学駒場博物館所蔵
• 石川県立自然史資料館所蔵
• 大阪教育大学附属図書館所蔵
???.repon.org
???.repon.org
公開リポジトリの 勝手位置付け
• 研究データ提供のためのリポジトリ
• 金沢大学資料館資料アーカイブ、http://kuvm.kanazawa-u.ac.jp/
• 国会図書館デジタルコレクション, http://dl.ndl.go.jp/
• Akebono VLF/MCA Data Repository, https://akebono-vlf.db.kanazawa-u.ac.jp/
• IUGONET, http://www.iugonet.org/
• 研究成果共有のためのリポジトリ
• 機関リポジトリ
• Dryad(http://datadryad.org/)
• figshare (http://figshare.com/)
サブジェクトリポジトリ FQDN(案)
• 博物館資料(コレクション):mus.materials.repon.org
• 教育掛図資料:edu.materials
• 科学実験機器:lab.materials, labware
• アーカイブス:archives.repon.org
• 学園史関係: historicalmaterials、archives
• (その他:data.repon.org)
• →weko.repon.orgは廃止
データリポジトリにおける バージョン管理事例
Dryad http://datadryad.org/
Dryad:DOI Usage
dryad. [DataPackage]
dryad. [DataPackage].[Version]
dryad. [DataPackage]/[DataFile]
dryad. [DataPackage]/[DataFile].[Version]
10.5061/
dryad. [DataPackage].[Version]/[DataFile].[Version]
Prefix
Suffix
Data Package
Data File 3
Data File 2
Data File 1dryad.3bp51
dryad.3bp51.1
dryad.3bp51.2
dryad.3bp51/1
dryad.3bp51.2/1.2
dryad.3bp51/3
dryad.3bp51.1/3.1
dryad.3bp51.2/3.2
dryad.3bp51/4
dryad.3bp51.1/4.1
dryad.3bp51.2/4.2
current
current
current
current
http://dx.doi.org/10.5061/dryad.3bp51.2
Title
Files in this package
Citing Information
Metadata
*Version History
Title
Citing Information
Metadata
File
*Version History
Data Package
Data File
figshare http://figshare.com/
Description
Title
Data Files
Citing Information
Description
• http://dx.doi.org/10.6084/m9.figshare.1186832
figshare http://figshare.com/
Data Files
http://figshare.com/articles/Journal_subscription_costs_FOIs_to_UK_universities/1186832/22
バージョン毎のlanding pageを用意 DOIは最新版のみ
DataCite https://www.datacite.org/
DataCite Metadata Schema 3.1 版管理関係のみ抜粋
• RelatedIdentifier(recommended)
• relatedIdentifierType
• DOI, ISBN, ISSN, URL, URN, etc.
• relationType
• IsNewVersionOf, IsPreviousVersionOf, IsOriginalFormOf
• Version(optional)
ref. http://dx.doi.org/doi:10.5438/0010
DataCite Metadata Schema v.3.1のメタデータ
• <oai_datacite xsi:schemaLocation="http://schema.datacite.org/oai/oai-1.0/ http://schema.datacite.org/oai/oai-1.0/oai.xsd" > • ~省略~ • <payload>
• <resource xsi:schemaLocation="http://datacite.org/schema/kernel-3 http://schema.datacite.org/meta/kernel-3/metadata.xsd" > • <identifier identifierType="DOI" >10.5438/0011</identifier> • <creators>
• <creator> • <creatorName>DataCite Metadata Working Group</creatorName>
• </creator> • </creators> • <titles>
• <title>DataCite Metadata Schema for the Publication and Citation of Research Data v3.1</title> • <title titleType="Subtitle" >XSD</title>
• </titles> • <publisher>DataCite e.V.</publisher> • <publicationYear>2014</publicationYear> • ~省略~ • <relatedIdentifiers>
• <relatedIdentifier relatedIdentifierType="DOI" relationType="IsDocumentedBy" >10.5438/0010</relatedIdentifier> • <relatedIdentifier relatedIdentifierType="DOI" relationType="IsNewVersionOf" >10.5438/0009</relatedIdentifier>
• </relatedIdentifiers> • <version>3.1</version>
• </resource> • </payload>
• </oai_datacite>
ref. http://oai.datacite.org/oai?verb=ListRecords&metadataPrefix=oai_datacite&set=~P3E9ZG9pJTNBMTAuNTQzOCUyRjAwMTE
データリポジトリにおける バージョン管理
• dryad • data packageおよびdata file 単位でlanding pageを用意 • バージョン毎にlanding pageが存在 • バージョンのすべてにDOIを付与(DOI構文にバージョンの概念を組み込んでいる)
• figshare • data set単位でlanding pageを用意 • バージョン毎にlanding pageが存在 • 最新のlanding pageのみDOIを付与
• Data Citeスキーマ • メタデータスキーマで必要に応じてバージョンの前後関係を記述
バージョン毎のDOI付与よりも、 landing pageで過去バージョンを示すのが現実的か
議論
DOI利用に向けた手順• 公開リポジトリ(weko.repon.org)の分割
• サブジェクトリポジトリのFQDN決定
• 国立情報学研究所が取り纏めるJaLC準会員の申請
• http://www.nii.ac.jp/irp/archive/system/jalc
• IRDBハーベスティング対応メタデータ整備(マッピング)
• http://www.nii.ac.jp/irp/archive/system/jalc
• Landing Pageの検討(引用方法について)
サブジェクトリポジトリ FQDN(案)
• 博物館資料(コレクション):mus.materials.repon.org
• 教育掛図資料:edu.materials
• 科学実験機器:lab.materials, labware
• アーカイブス:archives.repon.org
• 学園史関係: historicalmaterials、archives
• (その他:data.repon.org)
• →weko.repon.orgは廃止
Top Related