内容摘要:为了量化评估科学数据对于科研活动的价值,本研究构建了基于引用行为的科学数据集/数据仓储影响力和质量评价模型,并结合文献计量与网络计量方法,运用被引、下载、网络述及等指标,从多角度总结数据引用的行为特征,测量其与科学文献质量之间的关系。②从文献频次、下载频次、被引频次、网络述及等多角度发现数据引用多个指标之间存在一定的分组关系。基金项目:本研究受国家哲学社会科学基金青年项目“基于社区发现的学术WEB主题显著度研究”(项目编号:13CTQ031 )和中央高校基本科研业务费专项南京农业大学创新项目“科学数据集的引用行为及其影响力研究”(项目编号:SKCX2016005 )支持。
关键词:计量;科学数据;数据引用;频次;网络;南京农业大学信息科学技术学院;研究方向;仓储;信息检索;科研人员
作者简介:
摘要:科学数据引用对于实现科学数据的共享具有重要意义。基于引用行为建立针对科学数据的评估机制,有利于科研人员认识到科学数据再利用的价值,并正视数据引用的重要性,从而规范化数据引用。为了量化评估科学数据对于科研活动的价值,本研究构建了基于引用行为的科学数据集/数据仓储影响力和质量评价模型,并结合文献计量与网络计量方法,运用被引、下载、网络述及等指标,从多角度总结数据引用的行为特征,测量其与科学文献质量之间的关系,从而得出以下结论:①中英文文献在数据引用方面存在差异,英文文献数据再利用率相对较高,数据引用规范性更好;②从文献频次、下载频次、被引频次、网络述及等多角度发现数据引用多个指标之间存在一定的分组关系;③生物信息学领域中英文文献中数据集/仓储质量和文献质量之间存在显著的相关关系。
关键词:科学数据/引用规范/数据共享/生物信息学
作者简介:王雪(1990- ),女,南京农业大学信息科学技术学院,在读硕士生,主要研究方向:信息计量;马胜利(1976- ),男,中央司法警官学院图书馆,硕士学位,讲师,主要研究方向:网络信息资源开发与利用,信息检索。保定 071000;佘曾溧(1990- ),女,南京农业大学信息科学技术学院,管理学硕士学位,主要研究方向:信息计量。南京 210095;杨波(1981- ),博士学位,南京农业大学信息科学技术学院副教授,南京农业大学领域知识关联研究中心,主要研究方向:网络信息检索,信息计量,E-mail:boyang@njau.edu.cn。南京 210095
基金项目:本研究受国家哲学社会科学基金青年项目“基于社区发现的学术WEB主题显著度研究”(项目编号:13CTQ031)和中央高校基本科研业务费专项南京农业大学创新项目“科学数据集的引用行为及其影响力研究”(项目编号:SKCX2016005)支持。
1 引言
随着计算机技术在科研活动中的频繁应用,科研数据成为科研活动的重要产出。科研数据的价值作为学术生态系统的一部分这一事实已被越来越多的人认可[1],然而,由于技术、经济、政治和人力资源等方面的限制,并不是所有的科研人员都有条件进行基础数据集或者平台的建设,这就需要数据创建者能够主动提交科研数据到可用的开放平台,以便其他科研人员进行深入研究,以实现数据的再利用和研究过程的复现。数据共享能够极大程度地减少数据的重复搜集、提高科研效率、增加科研产出。基于目前相关技术、政策和激励机制比较缺乏的事实,科学数据共享的实践并不是很理想。科学数据引用作为科学数据共享的主要表现形式,其引用规则的制定是当前学界讨论的重点。实现科学数据引用形式的规范化便于对数据创建者的贡献度、数据的可靠性、数据的学术影响力进行科学评价。但是,鉴于目前并没有形成规范化的数据引用形式,科学数据引用行为的研究尚存在很多未解决的问题,科学数据对于科学研究的价值及影响力的评价更是无从谈起。
数据引用是类似于论文中的文献引用,也是一种基于出版物的引用方式。通过一定的标识技术和机制,对所使用的科学数据资源进行描述,标识数据的来源,从而在一定程度上促进数据的知识产权保护,便于进行数据引用情况的统计和分析[2]。数据引用规范化的重要性在学界已得到重视,但实施过程还是困难重重。首先,虽然研究人员已经意识到数据引用的重要性,但是还并没有形成对数据使用进行标识的习惯,致使数据引用行为随意而凌乱;其次,各学科领域的数据产生、传播、存在形式多种多样,很难制定适用于所有学科的统一标准;最后,因数据引用标准的制定涉及研究界与出版界中多个角色的利益与责任,这就需要制定的标准能平衡各方利益,而且能限定各角色应负的责任。国际数据引用综合工作组于2014年2月完成了数据引用共同原则的最终定稿[3],这些原则可以扩展到所有学科以及各种类型的数据中,且学术界和出版界在数据引用实践上达成了广泛共识。这一共同原则的出现,使得数据引用标准化的实现又向前迈进了一步。
科学出版物应该是由观点以及支持该观点的论据组成的[4],而数据就是最具科学性权威性的论据。随着数据引用逐步规范化,对于科学数据的引用行为进行合理评估也应该引起人们重视。本研究为实现科学数据价值的定量化评价,通过构建基于生物信息学领域的数据引用元数据的框架,并借鉴基于引文分析的文献计量和基于影响力分析的网络计量的评价方法,以引用、下载和网络述及为主要评价指标,试图从多角度量化评价数据引用对于科学文献的重要程度。此外,通过中外数据引用行为对比分析,以揭示国内外在科学数据管理平台建设、科学数据引用形式特征等方面的异同点。






