Code4Lib 2010報告会・発表ダイジェスト
-
Upload
masao-takaku -
Category
Business
-
view
1.837 -
download
0
description
Transcript of Code4Lib 2010報告会・発表ダイジェスト
Code4Lib 2010全体プログラム
• 0日目– チュートリアル
• OCLC Web Services
• 1日目– 発表セッション
• 「クラウド」×5• 「メタデータ」×4
– 基調講演
– ライトニングトーク
– ブレイクアウトセッション
• 2日目– 発表セッション
• 「開発環境」×3• 「マイグレーション」×2• 「検索」×4
– ライトニングトーク
– ブレイクアウトセッション
• 3日目– 発表セッション
• 「モバイル」×3– 基調講演
– ライトニングトーク
発表セッションの要約をひたすらやります…3
OCLC Web Services(Pre‐Conferenece session)
• OCLC Web Services Tour• OCLC xID• WorldCat Basic and Search APIs• WorldCat Registry• WorldCat Identities• Sample code and demos
4
5
7
http://www.worldcat.org/xissn/titlehistory?issn=1532‐2882
8
http://www.oclc.org/worldcat/newgrow.htm
国内では…
• NII国立情報学研究所による NACSIS‐CAT– 雑誌変遷マップ
• http://www.tulips.tsukuba.ac.jp/misc/export/cat/show‐family.html
– 所蔵図書館マップ
• http://myrmecoleon.sytes.net/map/
• あとは API があれば…→ WebcatPlus APIに期待… (4月にリリース予定)
10
国内では…
• NII国立情報学研究所による NACSIS‐CAT– 雑誌変遷マップ
• http://www.tulips.tsukuba.ac.jp/misc/export/cat/show‐family.html
– 所蔵図書館マップ
• http://myrmecoleon.sytes.net/map/
• あとは API があれば…→ WebcatPlus APIに期待… (4月にリリース予定)
11
http://www.tulips.tsukuba.ac.jp/scripts/show‐family?id=AA00240495
12
http://myrmecoleon.sytes.net/map/?isbn=4‐7571‐0245‐3
1日目・発表セッション「クラウド」
• Cloud4Lib• The Linked Library Data Cloud: Stop talking and start doing
• Do It Yourself Cloud Computing with Apache and R
• Public Datasets in the Cloud• 7++ Ways to Enhance Library Interfaces with OCLC Web Services
13
Public Datasets in the Cloud
• 公的情報のオープン化
• クラウドの中でいわゆるGov2.0のようなデータを扱う方法。
– たとえば:http://www.socrata.com/government/White‐House‐Visitor‐Records‐Requests/644b‐gaut にあるホワイトハウスの訪問者リスト、から時系列に可視化…。など
• アーカイブス(公文書館)
• 書誌以外のデータ
18
7++ Ways to Enhance Library Interfaces with OCLC Web Services
• おおむね前日のOCLCセッションで見たデモ
• ニューヨークタイムズ紙のAPI(ベストセラー、書評)とのマッシュアップなど
• (日本でも)– Amazonだけでなく、出版社など、ベストセラー、レビュー情報APIがあると、図書館サイトでの発展的な情報提供のタネになりうる。
– → だれかやってください!
19
1日目午後・発表セッション「メタデータ」
• Taking Control of Library Metadata and Websites Using the eXtensible Catalog
• Matching Dirty Data Yet Another Wheel• HIVE: A New Tool for working with Vocabularies
• Metadata Editing, a truly extensible solution: Trident
20
Taking Control of Library Metadata and Websites Using the eXtensible Catalog• XC (eXtensible Catalog)
– ここ数年注目の「次世代OPAC」の代表格• オープンソースOPACソフトウェア
• かなりまとまってはいたけど、20分では足りないほどの機能満載ぶりに圧倒された。
• (日本では)今年度に九州大で導入され、国内初の試みと評判に。→ 詳しくご存じの方いれば補足お願いします。
21
Matching Dirty Data Yet Another Wheel
• 名寄せのお話。
• MARCデータ、Dspace機関リポジトリアイテム、学位論文アイテム
– 名寄せ用フィールドにどこを使えばよいか等
• 複数の書誌マッチングのためのデータ作成
• それら同士の比較照合用の文字列比較関数の工夫により、人手判定の手間を減らす方式の紹介
22
1日目・ライトニングトーク• UW Forward ‐ Steve Meyer• MODS4Ruby & Opinionated XML ‐Matt Zumwalt• The Digital Archaeological Record ‐Matt Cordial• Hydra: Blacklight + ActiveFedora + Rails ‐Willy Mene• Why CouchDB? ‐ Benjamin Young• Data integrity (cheap, fast, and easy) ‐ Gwen Exner• HathiTrust Large Scale Search update ‐ Tom Burton‐West• EAD and MARC Sitting in a Tree: Archival Description in Drupal ‐Mark
Matienzo• EZproxy Wondertool ‐ Paul Joseph• HathiTrust APIs ‐ Albert Bertram• Repository of MARC Abominations ‐ Simon Spero and J‐Rock• Mystery Meat ‐ Joe Atzberger• Fuwatto Search ‐Masao Takaku
25
Fuwatto Search• 「ふわっと関連検索」
• マッシュアップツール
– 国立情報学研究所(NII)が提供するCiNii API– コンテンツマッチによるマッシュアップ
• OCLCチュートリアルセッションにて、説明を受けたWorldCat Basic APIを使ったサービスをデモ
– 意外と受けが良かったので、会議本体のライトニングトークに申し込み。
• 帰国後も、ウィジェット化など、随時開発中!
26
http://fuwat.to/ciniihttp://fuwat.to/worldcat
2日目午前・発表セッション「開発環境」
• Iterative Development Done Simply• Vampires vs. Werewolves: Ending the War Between Developers and Sysadmins with Puppet
• I Am Not Your Mother: Write Your Test Code
27
Iterative Development Done Simply
• アジャイル開発:– ノースカロライナ州立大学 図書館システム開発チーム
– 6週を1サイクルとして動かすアジャイル開発
– ボード、チケット管理、開発担当者の割り当て
• 問題点提起:– 図書館員の動きが遅い
– 文書化された仕様が少ない
– 優先順位付けが難しい
• (感想)モダンな開発手法をどのように図書館実践の中に用意していくか?そこが問題かも、と読んだ。
28
2日目午前・発表セッション「マイグレーション」
• Media, Blacklight, and Viewers• Becoming Truly Innovative: Migrating from Millennium to Koha
31
Becoming Truly Innovative: Migrating from Millennium to Koha
• 図書館システムの移行– 商用の図書館システムIIIから– オープンソースソフトウェアKohaへ
• 移行が必要な書誌レコード、利用者レコード、貸出レコードなど種別毎に、複数の移行方式を比較検討– それぞれの労力とコードを解説
• たとえば、– CSVでは、入れ子・繰り返しデータを扱えないので、無理が出る
– XSLTは変数指定といったプログラミング環境に欠けているので、メンテナンス性に欠けるし、実質的に無理
• かなり実際的で、非常に参考になった。
33
2日目午前「Ask Everything!」セッション• 「Human Search Engine」のセッション
– 「だれか、うちで持ってる問題を解決する方法を知ってるいるかい?と会場中に呼びかけて、必要な人を見つけて、ランチの間に話をしてください」というもの
• 質問が尽きないのがすごいところ。• 全部で30人くらい質問が出た。• 質問の一部:
– わたしが次に学んだほうがよいプログラミング言語は?→ Ruby, Python, Java, …
– MySQLの大規模データ対応・高速化の仕方?– WorldCat APIキーの隠蔽方式?– BlackRay? SharePoint?– Code4Lib Journal次号で普通の図書館員に送るシステム周りで知っておくべ
きことリストみたいな特集で記事を書いてくれる人?– ログ分析?– アカウント制御?– Facebookアプリの経験のある人?– Unicode の正規化?– などなど 34
2日目午後・発表セッション「検索環境の改善」
• A Better Advanced Search• Drupal 7: A more powerful platform for building library applications
• Enhancing Discoverability With Virtual Shelf Browse
• How to Implement A Virtual Bookshelf With Solr
35
Enhancing Discoverability With Virtual Shelf Browse
38
Enhancing Discoverability With Virtual Shelf Browse
• 本日2度目のNCSU登場。
• 正統派図書館システムの拡張としての仮想書架サービスの実装を解説。– 仮想書架サービスとは、ここでは書架に並んでいる順番での
OPAC書誌のブラウジング支援
• ex.http://www2.lib.ncsu.edu/catalog/record/NCSU600111• 実サービスとして運用するには、インデックスの作り方など、
高速化の工夫が必要(らしい)
• また、どうやってそのためのデータを作るのか、というところから解説。
• http://www.lib.ncsu.edu/dli/projects/virtualshelfindex/– 仮想書架サービスについてのドキュメントもある。
39
How to Implement A Virtual Bookshelf With Solr
• (3度目のStanfordチーム登場)
• NCSUと同様、仮想書架サービスとしてSolrでの分類記号ブラウズの実装を解説。
• (感想)純実装的には、なんとなくSuffixArrayを使ったほうがよさげ、と思わなくもない。
40
41http://searchworks.stanford.edu/view/2179288
3日目・発表セッション「モバイル」
• You Either Surf or You Fight: Integrating Library Services With Google Wave
• library/mobile: Developing a Mobile Catalog
• Mobile Web App Design: Getting Started
42
library/mobile: Developing a Mobile Catalog
• モバイル用OPACシステムに求められる要件とテストケースを設定して、モバイルOPACの簡易ユーザビリティテストを実施した結果を報告。
– cf.http://www.slideshare.net/kimberlygriggs/librarymobile‐developing‐mobile‐catalogs
• (感想)マトリックスによる表現は圧巻! GJ! 今回の発表セッション中では、最も感銘を受けた報告の一つ。
44
Mobile Web App Design: Getting Started
• Mobileウェブアプリケーション構築用のツールキットと、エミュレータ群の紹介
– iPhone– Andoroid– Palm– OperaMini
• 書架情報をモバイルで一覧表示させるShelfListerツールを公開中
45
おわりに
• 参加者は、コード書き(システム開発者・管理者)と図書館員とが半々くらい
• 図書館員はプロジェクトマネージメント
• (国内の視点で考えると)– 米国は図書館先進国
• 人材、資金
– ただし、日本でも似たような事例はたくさん…– 来年は日本からの発表もあるでしょう!
• Next‐L Enju• …
46