现在的位置:主页 > 期刊导读 >

我国政府数据开放度及开放质量研究

来源:大数据 【在线投稿】 栏目:期刊导读 时间:2020-10-05

【作者】:网站采编
【关键词】:
【摘要】:一、引言 西方国家如美国一直非常重视数据分析及应用。20 世纪90年代以后,美国联邦政府积极推动各部门数据开放,以利于公众使用数据,奥巴马曾形容政府数据开放工作是“前所未

一、引言

西方国家如美国一直非常重视数据分析及应用。20 世纪90年代以后,美国联邦政府积极推动各部门数据开放,以利于公众使用数据,奥巴马曾形容政府数据开放工作是“前所未有”的事业。近年来伴随着大数据技术的发展,数据开放在世界范围内盛行,2011年开放政府联盟(OGP)成立,致力于推动各国政府的信息公开和数据开放工作。截止2013年底,会员国从8 个扩大到50 多个,其中还有不少发展中国家,例如肯尼亚、爱沙尼亚、东帝汶等。

在我国,2015年国务院印发《促进大数据发展行动纲要》指出,“大力推动政府信息系统和公开数据互联、开放共享,加快政府信息平台整合”。各省市政府加快建设政府数据开放平台,上海市、北京市等一线城市不断完善原有的数据平台,推进各政府部门向社会开放政府数据资源。其他省、市在学习借鉴的基础上,也纷纷建设特色政府数据开放平台。如贵州省在多方企业的支持下,建立的“云上贵州”服务平台。

本文定量测度我国政府的数据开放度及开放质量。以政府开放数据中的“人口数据”作为切入点,以美国LEHD 项目和中国政府数据开放平台在数据开放量与开放质量进行比较研究。

二、研究设计及方法

当今世界,美国政府开放数据建设处于全球领先地位。本文参考选用涂子沛《数据之巅 大数据革命,历史、现实与未来》一书中部分内容。把匹兹堡市数据开放情况作为标杆,与国内上海市、武汉市和贵阳市三个数据开放平台比较,得出在政府数据开放层面的差距。

在研究方法上,使用比较研究法(Comparative Research)为主要的研究方法。林聚任、刘玉安认为:比较研究方法,是指对两个或两个以上的事物或对象加以对比,以找出它们之间的相似性与差异性的一种分析方法。在数据收集方面主要是通过搜索相关政府文件,检索统计年鉴以及查阅相关书籍的方式收集有关人口数据开放的情况。

在研究对象上,国外研究对象选择美国匹兹堡,根据《数据之巅 大数据革命,历史、现实与未来》,在美国,公民可以通过LEHD 系统查询政府开放的各个方面数据。而考虑到地方政府数据开放的成熟度,国内的研究对象选择了武汉市、上海市、贵阳市三个地区。上海代表着一线城市,是中国政府数据开放最早、最好的一部分城市;武汉代表着中部大城市的政府数据开放,数据开放时间晚于上海等一线城市;贵阳市的选择,主要考虑到“云上贵州”是时下热点,是在联通、阿里巴巴、中软、浪潮等企业的支持下,全国第一个实现省级政府、企业和事业单位数据整合管理和互通共享的云服务平台,社会关注度较高。

本文选择人口数据作为研究的切入点。对于任何一个地方政府来说,掌握人口数据可以为在制定政策中发挥重要的作用,做出合理的预期,调整政策的变化,并且最终会使每个参与普查的人受益。企业通过政府开放的人口数据,可以准确了解地区的经济发展前景以及投资潜力,做出合理的发展决策。

三、定量分析

(一)开放量分析

以人口数据为切入点,在各个数据开放平台上收集就业人口的年龄、性别、收入高低、行业分布(部分)的信息,统计数据量的开放情况,其中1 表示有该方面数据开放,0表示无此方面数据开放。

在性别、平均工资、从事职业分类上,四个政府都开放这方面的数据。但在工资范围上,国内的三个政府没有公开这方面数据。相比较国内的三个政府,上海在年龄、种族的分类数据开放上比武汉和贵州做得要好得多。

各个分类数据的开放只有两种结果,发布与不发布。假设每次试验中,事件1 发生的概率为p。根据二项分布,在n重伯努利实验,用X 表示7 重伯努利试验中事件1 发生的次数,则X 的取值为0,1,…,n,且对每一个k(0≤k≤n),事件{X=k}即为“n 次试验中事件A 发生k 次”,根据伯努利模型,有

根据上述公式,可以得出每一个政府在七种分类中,事件0 发生(数据不开放)的概率。由此可以得出政府数据开放的情况。概率越大,说明政府数据开放越差。武汉市和贵州省的政府数据开放性差,在选择的七个分类中,有三项没有开放,概率为27.34%,远远大于匹兹堡市和上海市的5.47%。

(二)开放质量分析

数据开放粒度是标示数据开放质量的指标。上面所列举的数据,是以城市为单位进行的数据量分析,但对于数据使用者来说,最重要的是数据开放的粒度。在LEHD 中,可以按照地区、邮编、选区、学区、人口普查的片区等各层级单位对人口数据进行层层下钻,甚至连一个居民街道的人口情况都能分析出来。比如帕罗奥多市的一个苹果店,市民在OntheMap 上定位之后,可以轻松的查询到店面所在街区的工作人口、人口流动、工作人口的来源及其距离分布、居住地到工作地的距离分布等信息。在此基础上,LEHD 系统还可以时间为跨度做纵向分析,显示城市某个地区在近几年的人口变化以及就业形势趋势的状况。这些人口数据的开放质量是国内政府难以达到的。

文章来源:《大数据》 网址: http://www.dsjzz.cn/qikandaodu/2020/1005/1068.html

上一篇:无所依 组诗
下一篇:制药企业确保数据完整性的措施探讨

大数据投稿 | 大数据编辑部| 大数据版面费 | 大数据论文发表 | 大数据最新目录
Copyright © 2018 《大数据》杂志社 版权所有
投稿电话: 投稿邮箱: