首页 >> 图书情报学
数据治理研究述评
2018年01月18日 09:55 来源:《情报杂志》 作者:张宁 袁勤俭 字号

内容摘要:现有研究存在“实证研究较少”“数据治理框架模型的设计欠缺优化”等问题,“框架体系”“政策标准”“成熟度模型”“数据质量”等仍是未来研究应关注的重点领域,海量异质数据的治理是未来最值得关注的新兴研究领域。

关键词:数据治理;数据质量;数据科学

作者简介:

  作者简介:张宁,0RCID:0000-0003-1318-8420(1981- ),女,南京大学信息管理学院博士研究生。南京 210023;贵州财经大学信息学院副教授,系主任。贵阳 550025;研究方向:信息资源管理,信息分析与应用;袁勤俭,ORCID:0000-0002-9684-9943(1969- ),男,博士,南京大学信息管理学院教授,博士生导师,研究方向:信息服务。信息分析与应用。南京 210023

  内容提要:[目的/意义]数据治理是数据科学时代关注的研究课题,对数据治理的概念、体系、内容和应用的相关研究进行述评,以期将数据治理研究引向深入。[方法/过程]采用文献调研法,对国内外文献进行系统脉络梳理和整体内容述评。[结果/结论]目前研究主要集中在“框架模型的设计”“价值的探讨”和“不同领域的应用”等,现有研究存在“实证研究较少”“数据治理框架模型的设计欠缺优化”等问题,“框架体系”“政策标准”“成熟度模型”“数据质量”等仍是未来研究应关注的重点领域,海量异质数据的治理是未来最值得关注的新兴研究领域。

  关 键 词:数据治理 数据质量 数据科学

  标题注释:商务部国际贸易经济合作研究院联合基金“大数据环境下的农业数据资产管理研究”(编号:2016SWBZD17)的研究成果之一,贵州省教育厅青年科技人才成长项目“面向数据资产管理的数据质量评价关键技术研究”(编号:黔教合KY字[2016]181)的研究成果之一。

  中图分类号:G203 文献标识码:A 文章编号:1002-1965(2017)05-0129-06

  数据科学促进了科学研究的新范式,使得数据处理事务、管理的视角、过程和方法都发生了显著的变化。随着组织业务的增长,产生了高价值多结构的海量数据集,对传统的数据管理手段和方法均提出了新的挑战,增加了组织对数据进行治理的重要性和紧迫性。

  数据治理不仅受到业界的重视,其相关研究也引起了学界的关注,国外学者Alhassan、sammon和Daly[1]对来自6个学术数据库(the AIS electronic library、CiteSeerX、EBSCO、Emerald、ScienceDirect and the ACM Digital library)的31篇文章进行内容分析,发现了110个数据治理活动;此外,Soma、Termeer和Opdam[2]在Scopus检索平台上分别以“数据治理”“信息流对组织带来的改变”为主题选取了39篇文章,对该两个主题进行双向的文献计量比较,总结了未来数据治理研究的核心发展趋势。相较而言,国内学界虽已有了一些与数据活动有关的述评类文章[3-4],但未见数据治理整体内容的述评。因此,本文拟定对数据治理研究进行系统脉络梳理和整体内容述评,希望尽可能厘清国内外数据治理的研究内容和存在的不足,以期对开展数据治理的相关研究提供一定的启示。

  1 数据治理的概念研究

  1.1 数据治理的基础定义 数据治理是组织中涉及数据使用的一整套管理行为。相关研究机构发布了各种有关数据治理的定义,由于切入视角的不同,一些国外学者从法案遵循的角度提出数据治理是一系列的政策和规则的定义[5],而一些学者强调数据治理是有关组织数据资产的决策制定和职责划分[6-8],也有诸多学者综合考虑了数据管理控制活动中的过程、技术和责任等[9-12],认为数据治理是集中人、过程和信息技术的数据管护过程或方法,能够确保组织数据资产得到合理的使用。因此,Begg和Caira[13]将早期的数据治理定义总结为政策、流程、技术和职责的统一,而后期的定义中更强调角色支持和商业结构。

  国内对于数据管理的有关研究活动始于2010年左右,类似的名词出现有数据监护[14]、数据管理[15]、数据策展[16-17]、数据管护[18-19]等,一直以来,国内在概念界定上都较为模糊,虽然都涉及数据的控制、保护和利用,但与数据治理的核心要义还是有一定的区别,除少数以外[20-21],多数学者在应用时对数据治理的概念均不加以解释和说明,认为数据治理与数据管理类似,都是有关数据生命周期的诸如采集、加工、控制、传输、保存等活动。

  由此发现国外的概念虽然在表述上有一定的差别,但核心内容上均具有一些共同点,而国内的概念使用却较为混乱,相关学者还未达成共识,并且多数研究都未触及数据治理的本质。数据治理不仅是通过数据的管理提升数据质量,更强调流程设定和权责划分,我们认为数据治理是围绕数据资产展开的系列工作,以服务组织各层决策为目标,涉及有关数据管理的技术、过程、标准和政策的集合。

  1.2 数据治理的内涵界定数据治理根植于IT治理,但两者之间又有明显的区别,Khatri[6]明确指出了IT治理的对象是IT系统、设备和相关基础设施,而数据治理的对象是可记录的数据,文中还区分了数据治理和数据管理,认为数据治理是为了确保有效管理而做的决策,强调决策制定的责任路径,数据管理仅仅涉及决策的执行;同时,Koope等[22]分析了IT治理的局限性,认为IT治理过程中过于强调IT投资和系统实施,忽视了商业价值增长中的数据创建、处理、消耗和交换方式。此外,由于研究调查中表明超过70%,的人将数据视为战略资产[23],因此大量学者[11-12,24-26]持有观点认为数据治理与数据资产密不可分,认为只有将数据治理视为公司或机构管理的重要数据资产内容,将数据置于组织的战略资产的位置,才有可能迎接当下的竞争挑战。

  国内学者包冬梅等[21]于2015年专门厘清了数据治理和数据管理的区别,认为治理和管理是完全不同的活动,治理是有关管理活动的指导、监督和评估,而管理则是根据治理制定的决策来执行具体的计划、建设和运营。

  由前述可知,数据治理具有丰富的内涵,不仅是对IT技术的简单关注,还需解决相关的政策流程和人员分配问题,其核心是通过数据治理计划,确保组织高层有效安全地利用数据生成决策。

  1.3 数据治理的价值要义 2012年的调查显示[25],接近2/3的受访者认可数据的分析和使用能够为组织带来竞争优势。在此背景下,Tallon[28]认为数据是一种特殊的资产,尽管在资产负债表中没有显示数据的价值计量,但数据的管理成本和价值创造却是明显的;类似地,Bhansali[29]在书中也阐述了数据治理的价值,认为数据治理的规范能够帮助组织更有效地管理数据,降低信息使用成本,提高法案遵循和控制的效力,促进高质量数据的生成。此外,Trope等[30-31]均认为数据治理应和各个商业部门相结合,而非仅仅是IT部门的事情,良好的数据治理能够帮助公司避免内部控制错误的发生。

  国内学者在数据治理的应用研究中,均从不同视角强调了其重要价值,如在图书馆领域,顾立平[32]从数据获取、数据共享、数据重用三方面证实了数据治理是图书馆事业的重要发展机遇;苏玉娟[33]通过对高新技术企业的实证研究,帮助企业实现数据治理,提升企业决策水平;此外,单勇、许晓东等[20,34]从社会治安防控体系建设、高等教育的视角等,强调了数据治理的必要性和价值性。

  可见国内外许多学者在数据治理的领域都讨论了与价值创造或提升相关的话题,从全球范围来看,数据治理是保证数据质量的必需手段,数据治理的价值贡献在于确保数据的准确性、可获取性、安全性、适度分享和合规使用。

分享到: 0 转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们