数据分析与知识发现
    主页 > 综合新闻 >

让大数据助阵七人普

从上世纪八十年代第三次人口普查开始,我国在人口数据信息系统方面不断完善,数据采集处理工作取得较大进步。然而,在人口普查数据信息逐渐增多的背景下,若单纯依托于以往的统计或查询等功能,很难使数据的实际价值得到充分发挥,带来资源利用率过低等问题。如何将大数据时代的物联网、云计算、移动互联等技术与第七次全国人口普查有机结合起来,推进统计数据采集手段革新,优化数据汇总方式,充分挖掘数据的关联性,提高数据信息使用效率,对促进统计工作高质量发展具有重要意义。

人口普查特征

一是普及性。实际普查过程中需在固定范围内对所有被调查对象进行普查,避免出现重复或遗漏调查的情况。

二是时间较为固定。现行国内外人口普查在时间上多结合不同人口特性、不同职业与行业等进行普查标准日的界定,要求在固定时间内完成普查工作。

三是个体特殊性。由于普查过程中涉及不同特性的人口,若同时收集并分析所有类型特性人口资料将超出标准时间,因此需利用抽样方式,选取其中样本代表所有人口。

由此可以看出,人口普查与大数据都追求从混杂数据中提取普遍意义的相关性,发现事物的内在联系和潜在规律。

将大数据引入人口普查

大数据技术是一个多学科交叉的新兴研究领域,汇集了机器学习、模式识别、数据库、人工智能、统计学以及管理信息系统等各学科的研究成果。将大数据技术引入人口普查,具有三点意义。

首先,针对人口普查数据,运用大数据技术分析其中较为深层次的知识,可为国家行政管理与政策制定提供重要依据。如针对不同社会群体包括青少年、老年或新婚夫妇等,教育部门、卫生部门、计划生育部门以及房屋管理部门都需依据其中不同类型人口信息进行政策调整。

其次,可为工商企业发展提供信息依据。以预估消费者需求为典型代表,要求数据信息必须详细准确且具备区域性特征,原因在于不同区域人口无论在年龄特征或职业收入等方面都存在较大的差异。

再次,通过大数据技术深度挖掘,还可以获得更多潜在信息和资料。例如,传统的人口普查统计数据仅获宏观数据,而大数据技术可以清晰反映出一定时期、一定地区的性别比、出生率、生育率、年龄中位数以及平均预期寿命等详细人口指标,并为我国人口政策的制定、控制提供一定的依据。

特别是在深入了解我国人口状况方面,运用大数据技术还可揭示出往常所忽视的一些数据内在联系,诸如人口增长与地区文化之间的相互关系、各区间人口结构差异、各地区人口老龄化比率等。

随着大数据技术在人口普查大规模运用,我们应进一步明确大数据的相关概念,正确认识大数据应用的意义,并注重运用前的数据安全工作,这样,才能充分发挥构建的各种元数据库的功能,使人口普查数据的价值得以充分体现。

来源:中国信息报

作者:窦悉彰

-FIN-

D