数据分析与知识发现
    主页 > 期刊导读 >

国内外政府数据开放平台研究述评

政府数据开放平台聚合海量数据,发挥数据管理、发布、获取、传播、应用等核心作用,贯穿数据供给侧和利用端,优化数据资源配置并展示数据利用成果。复旦大学数字与移动治理实验室于2019年公布了《中国地方政府数据开放报告》[1],统计了自2012年伊始的上海、北京、湛江到2019年的天津、南京、成都等82个政府数据开放平台,与2018年相比,增加36个平台。这些平台由政府部门协同建设[2],目前还处于探索与成长阶段。我国与美国、英国、新加坡等国家政府数据开放平台相比,存在功能单一、用户参与度低、数据质量参差不齐等问题[3-6],需要政府部门协同解决以便更好地衔接政府与社会,充分发挥数据价值潜能。已有的政府数据开放平台综述针对国内文献做了发文量、年份及热点的初步计量[7],缺少对国外研究主题追踪与研究发展趋势的脉络把握,文献主题的内在关联还需深度挖掘。随着研究主题的深化、扩大,迫切需要厘清与梳理国内外政府数据开放平台研究,为政府数据开放平台后续研究与实践提供参考价值。

1国内外政府数据开放平台文献统计分析

1.1文献样本选择

在中国知网、万方全文数据库上以限定词“政府数据开放”“开放政府数据” “政府开放数据”等检索(截至2019年9月18日)文献,筛选出含有“平台”“网站”“门户”的相关研究234篇,以此作为国内政府数据开放平台的分析样本。在Web of Science、Scopus数据库上以“government data open”“government open data”“open government data”进行主题检索(截至2019年9月20日),筛选出含有“platform”“website”“portals”的文献77篇,以此作为国外政府数据开放平台的研究样本。由于国内外对政府数据开放平台的称谓有“开放政府数据平台”“政府开放数据平台”“政府数据开放门户”“政府数据开放网站”等,本文统一以“政府数据开放平台”为术语。

1.2政府数据开放平台发展历史脉络

国内外政府数据开放平台样本文献的时间分布情况见图1。

图1 2010—2019年政府数据开放平台发文量

如图1所示,国内发文总量多于国外、国内外发文量总体上呈逐年上升趋势、2018年是国内外发文量高峰,表明近年平台逐渐受到关注。基于样本时间分布将政府数据开放平台分为:①萌芽期(2010—2014年):萌芽阶段国内外首个政府数据开放平台分别建立于2012年、2009年(平台文献研究延后于平台建立,故样本文献始于2011年),此阶段平台发文量较少,国内外在研究初期的主题存在差异:国内从平台安全、增值服务等角度探讨了平台构建[8],国外较重视平台建设和关联数据应用[9]。②生长期(2015—2019年):生长阶段国内外政府数据开放平台建设的数量增长迅速[10-13],而平台数据的研究始终是重点内容[14-16],随着政府数据开放平台主题的扩散,国内外研究从内容层面延伸到了平台的用户[17-19]、政策[20-21]等更宽泛的视域。

1.3政府数据开放平台关键词共现分析

1.3.1 关键词共现分析 文献样本的核心内容可用关键词高度概括[22],本文运用Ucinet社会网络分析工具绘制国内外政府数据开放平台文献关键词共现网络图,见图2和图3。

图2 国内政府数据开放平台关键词共现网络

图3 国外政府数据开放平台关键词共现网络

取关键词频次≥3绘制国内政府数据开放平台关键词共现网络,网络节点大小代表关键词频次多少,节点连线粗细表示关键词关系的强弱程度。从图2看出政府数据开放平台以政府数据开放平台开发与功能(平台评估、平台建设等)、平台数据(数据评价、数据质量、数据共享、元数据、关联数据等)、政策(保障政策、数据政策等)、用户视角(用户体验、用户感知等)展开研究。国内关键词共现网络出现的美国、英国、上海等地名表明国内研究紧追国外并开拓本土平台研究。

由于国外研究样本远少于国内,为保证数据呈现的全面性,故取关键词频次≥2绘制国外政府数据开放平台关键词共现网络,从图3发现国内外政府数据开放平台共现网络具有相似性。政府数据开放平台基于政府数据开放,而后者需依托前者得以实现。图2和图3表明国内外都重点关注平台建设、数据和使用情况。

1.3.2 关键词重点主题剖析 Ucinet软件具备的小团体分析功能可用于挖掘样本文献间存在的隐形关系,揭示重点主题[23]。国内与国外政府数据开放平台关键词小团体分析在聚类过程分别达到12类和3类时出现拐点,出现拐点表明已达到最大聚类值,为保证国内外政府数据开放平台研究主题聚焦的一致性,本文将进一步扎根关键词以确定主题(见表1)。