第一部分 项目概况 第二部分 任务完成情况 第三部分 项目效益与成果...

42
“CALIS 高高高高高高高高高” 高高高高 姜姜姜 [email protected] 姜姜姜姜姜 姜 姜姜姜姜姜姜姜 2007.09.27 姜姜

description

提纲. 第一部分 项目概况 第二部分 任务完成情况 第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑. 第一部分 项目概况. 建设目标 主要任务. 建设目标. 在 “ 九五 ” 期间建设的 CALIS 学位论文数据库基础上,建设一个提供 “ 集中式元数据检索、分布式全文获取 ” 的 CALIS 高校博硕士学位论文数据库服务平台。为高校范围内的读者通过网络共享学位论文信息提供途径和保障,促进高校教学、科研水平的交流与提高 。. 主要任务. 建设 CALIS 高校学位论文数据库; - PowerPoint PPT Presentation

Transcript of 第一部分 项目概况 第二部分 任务完成情况 第三部分 项目效益与成果...

Page 1: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

“CALIS 高校学位论文数据库”总体进展介绍

姜爱蓉[email protected]

清华大学图书馆 学位论文项目组2007.09.27 南京

Page 2: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

提纲第一部分 项目概况 第二部分 任务完成情况 第三部分 项目效益与成果第四部分 经验体会与存在问题第五部分 下一步的考虑

Page 3: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

第一部分 项目概况 建设目标 主要任务

Page 4: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

建设目标在“九五”期间建设的 CALIS 学位论文数据库基础上,建设一个提供“集中式元数据检索、分布式全文获取”的 CALIS 高校博硕士学位论文数据库服务平台。为高校范围内的读者通过网络共享学位论文信息提供途径和保障,促进高校教学、科研水平的交流与提高。

Page 5: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

主要任务 建设 CALIS 高校学位论文数据库;

20 万条元数据,其中可提供全文服务的比例不低于 50%。

建设 CALIS 高校学位论文门户; 建立本地学位论文网上提交与发布系统; 形成一套学位论文标准规范; 建立一个支持项目可持续发展的机制

(项目管理和运作模式、系统运作模式)

Page 6: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

第二部分 任务完成情况 建设内容与具体指标 参建单位情况

Page 7: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

建设内容与具体指标

Page 8: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

CALIS 高校学位论文数据库建设 采用“ OAI+METS” 技术收集参建单位的元数据和前 16 页全文。 2006 年 6 月,从 13 家参建单位收集元数据 115,679 条,前 16 页全文58,230 篇。 2003 年项目提前启动后,约 30 家参建单位延续一期的 FTP 方式提交 4 万多条文摘索引数据。 “ 九五”完成的 10 万条数据经迁移与“十五”新增的 15 万条数据归并在同一平台上提供服务 , 建成具有 25 万条学位论文记录的 CALIS学位论文数据库。

Page 9: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

CALIS 高校学位论文门户建设http://etd.calis.edu.cn/user/Searchadd.do

Page 10: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

集中检索高校学位论文元数据并浏览前 16 页; 基于 OpenURL 技术实现元数据与本地系统的链接,实现可在线浏览已授权的论文全文; 建立按学科分类的导航体系(可逐层展开至三级学科),提供按题名、点击率等排序浏览; 支持 IP 、 IP+ 用户名 / 密码认证(注册用户); 为注册用户提供个性化定题通告服务;

CALIS 高校学位论文门户建设(续)

Page 11: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

CALIS 高校学位论文门户建设(续)

Page 12: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

CALIS 高校学位论文门户建设(续) 全文服务通过两种途径:1 )通过 OpenURL 技术链接到本地系统浏览获得作者授权 CALIS 范围内使用的论文全文;2 )通过 CALIS 馆际互借系统,由各参建馆提供全文获取的保障。通过以上途径,提供全文服务的比例达 50% 。

Page 13: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

CALIS 高校学位论文门户建设(续)

三级学科导航浏览

Page 14: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

CALIS 学位论文数据库的服务层面 :元数据级 公开免费提供检索论文前 16 页 公开免费提供浏览论文全文 通过认证(结算)管理提供在线浏览 或 通过馆际互借 / 文献传递提供传递获取

提供用户访问统计及学位论文库使用统计。

CALIS 高校学位论文门户建设(续)

Page 15: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

系统整体框架

Page 16: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

本地“学位论文网上提交与发布系统”建立 自项目启动以来 , 已有 80余所高校建立:新型的学位论文网上提交、管理机制本地学位论文全文网上提交与发布系统

实现了学位论文提交与发布一体化。每年在毕业生完成论文提交的同时就可以发布提供服务,经逐年累积,形成具有本校学科优势的学术资源库。 项目组从系统售后支持和可持续发展考虑,推荐四套由国内软件商开发的系统平台供参建单位选择使用,并以组团购买的方式争取优惠价,减少重复开发、成本低见效快。

Page 17: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

审核和编目

学生

审核员

编目员

发布服务

不合格合格

论文编目

检索

提交模块

文档标准化(全文文档标准化(全文 &16&16 页)页)原有论文数据迁移原有论文数据迁移

论文审核

论文发布 统计与评估结算模块

OAI & METS 接口

本地学位论文网上提交与发布系统主要功能提交表单

Page 18: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

形成一套学位论文标准规范 本项目采用与国际接轨、开放、先进的主流技术和通行的标准规范。主要标准规范与《我国数字图书馆标准规范》以及 CALIS相关标准规范保持一致。 项目承建单位清华大学图书馆参与了《我国数字图书馆标准规范》课题的子项目 -- 专门元数据组的标准规范制定工作,负责制定“学位论文描述元数据规范”。该规范收入《中国高等教育数字图书馆技术标准与规范》,并作为本项目参照的元数据标准在参建馆普遍使用。

Page 19: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

形成一套学位论文标准规范(续) 项目实施中制定并应用了一套相关标准规范,包括:《学位论文元数据描述元数据规范》《学位论文版权使用授权书》《学位论文提交系统核心表单》《学位论文提交和发布系统软件本地需求》《学位论文数字对象唯一标识符》《学位论文本地系统功能认证规范》《学位论文中心系统技术方案》《学位论文全文格式标准》等。

Page 20: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

项目可持续发展机制的建立项目管理 采用承担单位与参建单位联合建设的模式。 通过签定“ CALIS 高校学位论文数据库建设协议书”的形式确定参建单位的义务、责任和权利。 由 8所学校代表组成的“项目管理组”(北京大学、中国农业大学、吉林大学、上海交通大学、武汉大学、中山大学、西安交通大学、清华大学),讨论决策项目进展重要问题,反映参建单位的意向,协调项目的进展; 清华图书馆组成项目实施小组并设立专岗负责项目的建设实施工作。

Page 21: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

项目可持续发展机制的建立(续)项目运作 资源共建共享机制。在高校范围内实现学位论文资源共建共享。参建单位不仅可以共享学位论文的元数据和论文前 16 页信息,而且在获得授权许可的情况下,通过开放链接可以远程浏览其他单位的学位论文全文 ; 补贴为主机制。根据各参建单位提交 / 收集的数据量分批划拨数据补贴费用; 激励为辅机制。根据各数据的质量和数量给予表扬和奖励(增拨数据补贴费用)。

Page 22: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

项目可持续发展机制的建立(续)系统运作 学位论文系统采用元数据集中检索、全文分布获取保障的运作模式。参建单位本地系统负责:①建立起本校的“学位论文网上提交和发布系统,收集数据、提供服务;②遵循项目制定的标准及技术规范,生成统一格式的元数据和 OAI-DP接口;③支持采用 OpenURL 技术建立元数据与本地全文库的链接;④自主控制学位论文全文的访问权限。子项目中心系统负责:①通过“ OAI+METS” 技术自动收集分布在参建馆本地的元数据;②提供学位论文元数据的集中检索和前 16 页的链接浏览; ③学位论文信息的个性化定制推送服务;④后台的用户管理和各层面统计。

Page 23: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

子项目参建单位情况

Page 24: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

“ 十五”项目启动以来, 2003 年 -2006年组织 3 次培训活动,参加学校 100 多所,培训人员 220 多人次。2007 年 9 月南京会议 ,报名参会的学校 90 多所 , 参会人数 150多人。 截止到 2006 年 5 月,已有 80 所学校正式签定了参加本项目建设的协议,有 20 多所学校参加了培训未签协议。

培训、签约情况

Page 25: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

建立本地系统情况: 分别选择 TPI 、 TRS 、方正、麦达等四个公司的学位论文软件建立本地系统的学校有 70余家,采用图书馆自己开发软件的学校有 4-5家。 据 2005 年统计,通过本地系统每年收集学位论文超出 1000 篇的学校有 33 家,不足200 篇的有 6-7 家。 截止到 2006 年 5 月, 10 余所学校的本地系统累计的学位论文数量超出 1 万条, 2-3 所学校累计超过 3 万条。

系统、数据情况

Page 26: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

第三部分 项目效益与成果“ 十五”与“九五”相比,学位论文项目的主要成效有: 学位论文网上提交利用机制的建立 数字图书馆新技术的规模化应用 高校学位论文库数据量大幅度增加 学位论文系统平台的标准化建设

Page 27: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

学位论文网上提交利用机制的建立 以本地网上提交发布系统的建设,牵动各学校建立起新型的学位论文收集和利用机制: 网上提交与管理、电子版保存与服务、授权使用与共享。 本地系统每年在毕业生完成论文提交的同时就可以即时发布提供检索服务。 新机制的建立,打破了高校多年以来学位论文以收藏纸本为主,只能提供到馆浏览或复印的有限服务,资源未能充分利用的局面。促进了各学校自有特色资源的数字化收藏和网络化利用。

Page 28: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

数字图书馆新技术的规模化应用 本项目技术方案采用 [OAI+METS]机制自动收集参建单位的学位论文元数据和前 16 页全文;采用开放链接技术实现集中元数据检索与本地系统全文的链接浏览。 以上数字图书馆新技术从理论上和试验上在国内外已获得广泛认同,但面对几十家单位采用的不同平台,实施数据在线收集,国内尚未有先例。尤其是采用 METS 格式,通过收割机制实时前 16页全文的在线收集,本项目所用方案和实施过程在国内外属领先尝试。

Page 29: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

数字图书馆新技术的规模化应用(续) “ 十五”学位论文项目建设遵循国际标准,采用数字图书馆新技术解决数据收集和互操作等问题是一个明显进步。 本地系统的建立,使得参建单位提交数据简单方便。“九五” 数据由馆员著录并用 FTP工具上载提交;“十五”数据由学生填写,馆员审查发布,子项目平台利用 OAI及METS技术在线 /离线收集。 新技术的采用,减少了各学校学位论文数据加工的投入,提升了数据收集的质量和效率,相关技术标准的培训和应用也提升了参建馆数字图书馆建设的技术水平。

Page 30: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

高校学位论文库数据量大幅度增加在参建单位的大力支持下,本项目“十五”新增学位论文数据量 15 万条,与“九五”完成的 10 万条数据归并在同一平台上提供服务,数据总量达到 25 万条。新增数据大部分包括学位论文前 16 页,并可通过 OpenURL 技术链接到本地系统浏览原文。“ 十五”新增数据来源于各学校的学位论文提交系统,在数据质量上与“九五”相比有明显提升。

Page 31: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

学位论文系统平台的标准化建设 本项目采用和参照国内外已有、通行的标准规范,并根据项目发展的需要,自主制订了相关规范。 在项目实施中,这些标准规范已在参建单位中广泛使用,推动了我国高校学位论文系统平台的标准化和规范化建设,也为不同单位、不同层次的学位论文系统之间进行数据交换, CALIS 学位论文系统与其它数字图书馆系统之间的互操作奠定了良好的基础。

Page 32: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

第四部分 经验、问题以及下一步考虑 经验和体会 问题与措施 下一步的考虑

Page 33: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

经验和体会1 )顺应信息化发展,在高校普遍建立电子版学位论文网上提交和管理机制,改革了我国学位论文传统的收藏保存服务方式。 教育部高等教育司于 2004 年 10 月 18日下发—关于加强中国高等教育文献保障系统二期工程(CALIS )子项目建设的意见,其中有关学位论文建设的意见对各校学位论文本地系统的建立是一个及时推进。

Page 34: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

经验和体会

Page 35: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

经验和体会(续)2 )“元数据集中检索、全文分散保障”的建设方案符合分布环境下数字图书馆的发展趋势。 学位论文项目以两级系统(网上提交发布系统,集中检索服务系统)的建设牵动,在高校范围内建立了一个学位论文信息共享利用和分布服务的保障体系。 这种建设模式适合对“原生”数字资源的收集,不仅抓住了研究生毕业前提交论文的机遇,而且也充分调动了大学图书馆的积极性,在各馆建好本地系统的基础上,中心系统的数据收集就有保障。

Page 36: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

经验和体会(续)3 )学位论文项目促进校园机构库的建设 近几年来,国际上正在蓬勃开展 IR ( Institutional Repository)建设,欧美一些领先图书馆在中长期发展规划中普遍将 IR 建设作为一项重要任务。目前国际范围内已有 1000 多所大学开始建设校园机构库。国内中科院等单位也在开展这方面的研究和实践。 国际上认为机构库收集资源主要包括:预印本 (Pre-prints)、后印本 (Post-prints)、会议论文、教学材料、学生课程报告、学位论文、项目数据资料、计算机软件、图像、非静态的资源 (如影像、声音文件 )等。 学位论文项目建设经验可推广应用到 IR 建设。

Page 37: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

经验和体会(续)4 )在项目建设中,承担单位在确定方案和实施过程中要从调动参加单位的积极性和保护参建单位的利益出发。各参建单位在参与项目的过程中不仅仅只是提交论文数据,而且也推进了本馆数字化的发展,锻炼培养了队伍。5 )在项目建设中,尽量采用公认的标准规范和成熟技术(软件),减少开发投入,提高建设效率。

Page 38: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

参建单位的网络性能对大批量数据在线收集有一定影响。 因学位论文项目涉及到的参建单位较多,有些学校所在地区的网络带宽窄,网速慢,网络状况不稳定等因素都将给大批量的数据收集带来影响。这种情况下,一些参建单位仍需要采用 FTP 方式提交数据(离线收割)。 改进措施:项目组将 FTP 方式提交作为数据收集的第二套方案,子平台开发中实现了这项需求并在验收前采用 FTP 方式收集了一部分数据。

问题与措施

Page 39: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

作者在学位论文的授权使用上存在较大差距,影响到学位论文全文共建共享的程度。 绝大部分参建馆在收集学位论文时都同时获得作者的授权,有的学校几乎是所有作者都授权在 CALIS 范围内浏览全文,但有的学校只有 1/4或 1/3 的作者同意授权。 改进措施: 1 )在 CALIS 学位论文平台建成并提供服务的基础上,进一步扩大宣传,并向论文作者提供访问学位论文资源的权限,以此争取作者授权。 2 )总结参建单位获得作者授权的有效办法和经验,在成员馆中推广。

问题与措施

Page 40: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

广泛收集参建馆的学位论文数据 (在线、离线方式相结合 ),预计数据量增加 >10 万; 进一步完善“十五”的子项目门户平台建设(功能、性能、向上向下的融会贯通); 在已初步建立的“元数据集中检索、全文分散保障”体系框架下,逐步在参建馆推进学位论文全文的共享保障服务;

第五部分 下一步的考虑

Page 41: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

探讨学位论文全文的长期保存模式并开展小范围的实验; 欢迎各参建馆的各位同仁对高校学位论文数据库的下一步发展建言献策!

第五部分 下一步的考虑

Page 42: 第一部分 项目概况  第二部分 任务完成情况  第三部分 项目效益与成果 第四部分 经验体会与存在问题 第五部分 下一步的考虑

谢谢!请指正 .