首页 >> 图书情报学
国外高校图书馆科学数据的元数据服务研究
2018年01月23日 08:29 来源:《图书与情报》 作者:黄鑫 邓仲华 字号

内容摘要:使用文献调研法,介绍了元数据服务研究现状,总结了元数据在科学数据管理中的多方面应用。同时以部分欧美高校图书馆为例,从元数据的介绍服务、创建服务、咨询服务和培训服务四个角度探讨了国外高校图书馆科学数据的元数据服务内容。

关键词:科学数据;科学数据服务;元数据;元数据服务

作者简介:

  作者简介:黄鑫,女,武汉大学信息管理学院博士研究生;邓仲华,男,武汉大学信息管理学院教授,博士生导师。武汉 430072

  内容提要:文章使用文献调研法,介绍了元数据服务研究现状,总结了元数据在科学数据管理中的多方面应用。同时以部分欧美高校图书馆为例,从元数据的介绍服务、创建服务、咨询服务和培训服务四个角度探讨了国外高校图书馆科学数据的元数据服务内容。

  关 键 词:科学数据 科学数据服务 元数据 元数据服务

  标题注释:本文系国家自然科学基金资助项目“大数据环境下面向科学研究第四范式的信息资源云研究”(项目编号:71373191)与教育部人文社会科学重点研究基地重大项目“信息资源云体系及服务模型研究”(项目编号:11JD630001)的研究成果之一。

  中图分类号:G254.364

  随着数据密集型科研范式的兴起,科学数据逐渐成为科研活动的中心,科学数据的采集、分析、存储、共享和可视化开始成为科研活动的主题,科研成果的发现对科学数据的分析和计算也越来越依赖。元数据作为用于描述科学数据的数据,在科学数据的组织、存储、监护、检索、引用、出版等环节中都起到了至关重要的作用。高质量的元数据服务对于推进科研活动进程、加速科研成果产出具有重要意义,然而现有的科研工作者并不擅长创建元数据[1]图书馆作为传统科研支持与服务机构,积极开展科学数据的元数据服务极具必要性,如何面向科研人员的数据管理需求来开展元数据服务,开展什么内容的元数据服务是高校图书馆所需要思考的问题。

  1 高校图书馆科学数据的元数据服务研究现状

  Tenopir[1]在针对科研工作者的一项问卷调查研究中发现:(1)59.8%的受访科研工作者对自己的科研数据描述情况非常满意或比较满意;(2)26%受访者对于自己所使用的元数据创建工具表示满意,32%的受访者则表示不满意;(3)在元数据标准方面,56%的受访者表示他们不了解什么是元数据标准,22%的受访者表示他们习惯于使用自己实验室的元数据标准,该调查说明科研工作者并不十分擅长元数据的创建工作。2012年,Tenopir[2]再次对美国和加拿大地区的351所大学图书馆科学数据服务情况进行问卷调查,发现有11.9%的受访图书馆已经提供科学数据的元数据创建和转换服务,3.7%、10.1%和8.3%的受访图书馆计划在未来一年内、两年内和两年后提供元数据的创建和转换服务,66.1%的图书馆暂时没有相关的计划,另外,研究型大学相比于本科学位授予大学和职业大学的图书馆更倾向于开通元数据创建服务:受到NSF更多资助的大学图书馆更倾向于开通元数据的创建服务:拥有多于5000名学生的学校相比于人数少于5000人的学校更倾向于开通元数据的创建服务。Si[3]在对USA News排位世界前100名大学图书馆科学数据服务的调查研究中发现,28.7%的高校图书馆已经开始提供科学数据的元数据相关服务,涉及元数据的介绍和创建等方面。康奈尔大学科学数据管理服务团队RDMSG调查了一些受到NSF资助的科研工作者[4],结果显示:(1)40%的受访科研工作者曾经为自己的科学数据创建元数据,26%的受访科研人员从不创建元数据,32%的受访者则表示不确定;(2)仅有10%的受访者习惯按照一定的标准来创建元数据,9%的受访者从未按照标准来创建元数据,61%的受访者则表示不确定;(3)一些受访者会评论,说“我不知道什么是元数据”,这说明图书馆开展元数据介绍服务具有必要性。黄如花[5]调查了美国部分高校图书馆科学数据的元数据实践情况,从科学数据管理周期的角度分析了图书馆在科学数据计划阶段的元数据标准和元素推荐服务、科学数据描述与组织阶段的元数据标准选择服务和科学数据存储阶段的数据文档命名与格式规范服务。由研究现状可发现,现有高校图书馆对科学数据的元数据服务主要集中于实地调查研究,调查重点是科研人员使用元数据的习惯和技能程度,而对高校科学数据的元数据服务的具体内容、服务原则、服务方式等缺乏细致的总结与归纳。

  2 元数据在科学数据管理中的应用

  2.1 科学数据管理计划中的元数据

  自2011年开始,美国国家科学基金会NSF要求科研项目申请材料中必须包含科学数据管理计划DMP,而元数据方案是数据管理计划的核心组成部分之一,项目申请者必须提交元数据的内容、格式和标准[6]。英国生物技术与生物科学理事会BBSRC同样要求基金申请者提交个人的科学数据共享计划,其中包括元数据的格式和标准,如数据的来源或操作过程,以防止数据被误用,误解或混淆[7]。英国医学研究理事会MRC发布了数据管理计划的导航文件,要求基金申请者提交数据生成的方法、分析过程、来源、编码、变量等元数据内容[8]。另外,受到耶鲁大学[9]、麻省理工大学[10]、明尼苏达大学[11]等高校推荐的数据管理计划制定工具DMPTools也可以帮助科研人员创建元数据。

  2.2 科学数据存储中的元数据

  在科研人员计划将科学数据存储至机构仓储中时,需要为科学数据创建元数据,以增加数据的组织效率和被发现几率,也可用于数据的迁移和转换,数据标题、关键词、创建者、数据类型、来源和出处等是常见的元数据项。如普渡大学PURR数据仓储有一套较为完善的元数据生成工作流[12],提交给PURR的每个数据集都会获得完整的元数据,一部分元数据由提交数据的科研人员来创建,另一部分则由系统根据数据集特征自动识别并插入。PURR融合了多个元数据标准,以便充分描述更多类型的数据集,都柏林核心被用于数据发现和引用,METS标准用来表示数据集文件的结构和层次,MODS标准被用于标注数据集的创建者和访问权限,PREMIS标准则用来记录每个数据集经历的保存事件和知识产权。

  2.3 科学数据检索中的元数据

  元数据是数据检索的核心,用户需要向搜索引擎或服务馆员提交数据主题、题名、创作者、关键词等项目来获取所需科学数据。现在,元数据还被用于科学数据与科研文献之间的关联,通过对科学数据和科学文献添加数字对象唯一标识符DOI,可以有效地实现数据与文献之间的关联,用户可以在阅读科学文献时查看相关科学数据,也可以检索引用相关科学数据的科学文献。

  2.4 科学数据监护中的元数据

  元数据是数据监护的支柱,没有元数据的数据资源将不能被恢复,不能被识别,也将变得不可用[13]。DCC发布的数据监护生命周期模型在其内环中强调了元数据作为“描述信息”(Description)和“表示信息”(Representation)的重要作用[14],在该数据监护生命周期模型中,与元数据相关的活动包括:(1)为数据集分配管理性元数据、描述性元数据、技术性元数据、结构性元数据和保存元数据;(2)采用适当的元数据标准以确保数据被长期合理的描述与控制;(3)收集数据表示信息,以充分理解数字资料和相关元数据。

分享到: 0 转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们