京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据来了 给政府统计带来了机遇与挑战
对于政府统计机构来说,没有什么比数据更重要的了。我们研究统计分类标准、统计调查方法、统计数据采集方式、统计数据加工处理方法、统计数据评估技术,都是为了获取真实准确、完整及时、代表性强、分类科学、经济适用的统计数据。
大数据时代的到来,既给政府统计带来重大发展机遇,也带来严峻挑战。
一、大数据在政府统计中的应用
国家统计局高度重视大数据在政府统计中的应用。到目前为止,已经与17家大数据企业签订了战略合作协议。当然,目前大数据在中国政府统计中的应用仍处于起步阶段,主要表现在两个方面:一是大数据成为政府统计数据的部分资料来源;二是大数据成为政府统计数据质量的部分评估依据。
(一)大数据成为政府统计数据的部分资料来源
目前,大数据已经成为中国政府统计数据的部分资料来源,以下是几个有代表性的方面:
1.利用重点网上零售交易平台数据测算网上零售额
为了掌握网上零售交易平台的交易规模和结构,综合测算网上零售数据,从今年1月份开始,国家统计局实施了月度网上零售交易平台调查,调查范围为42家重点网上零售交易平台,包括京东商城、亚马逊、当当网、淘宝网、天猫商城、酒仙网、美团网、中粮我买网、国美在线、大众点评网等。据对上述42家重点网上零售交易平台数据测算,今年1~8月份,全国网上零售额22400.9亿元,同比增长36.5%。其中,实物商品网上零售额18653.4亿元,增长35.6%,占全部网上零售额的83.3%;非实物商品网上零售额3747.5亿元,增长41.1%,占全部网上零售额的16.7%。这对于宏观管理部门和社会公众了解网上零售情况具有重要的参考作用。
2.利用房屋交易网签数据计算全国70个大中城市的新建住宅价格指数
房屋交易网签数据是指买卖双方签订购房合同后,房地产开发企业在房管部门进行备案,并在房产信息网上公布的相关信息,包含地址、楼层、价格、面积和金额等详细信息,基本涵盖了当月新建住宅的全部交易情况。从2011年1月份开始,国家统计局开始采用房屋交易网签数据计算全国70个大中城市的新建住宅价格指数。这对于提高70个大中城市新建住宅价格指数的数据质量起到了重要作用。
3.利用卓创资讯公司提供的价格信息,开展流通领域重要生产资料市场价格监测
国家统计局与卓创资讯公司开展合作,利用该企业提供的价格信息,开展流通领域重要生产资料市场价格监测。从2014年1月开始,按旬共同向社会发布流通领域9大类50种重要生产资料市场价格的检测结果。行业涵盖黑色金属、有色金属、化工产品、煤炭、石油天然气、非金属建材、农产品、农业生产资料、林产品等领域。地区监测范围覆盖北京、天津、河北、山西、内蒙古、辽宁、吉林、上海等24个省区市。这对于宏观管理部门和社会公众了解流通领域重要生产资料市场价格信息起到了重要作用。
(二)大数据成为政府统计数据质量的部分评估依据
国家统计局除了把大数据作为政府统计数据的部分资料来源外,也高度重视利用大数据评估政府统计数据质量。以下是目前比较有代表性的两个方面:一是利用中国银联跨行银行卡消费数据评估社会消费品零售总额数据质量;二是利用大型机械装备企业物联网数据评估固定资产投资数据质量。
二、大数据给政府统计带来的机遇与挑战
对于政府统计来说,大数据既带来了重大发展机遇,也带来严峻挑战。
(一)大数据给政府统计带来重大发展机遇
首先,大数据将不断提高政府统计服务宏观管理和社会公众的能力。随着大数据的不断发展和完善,随着政府统计机构开发应用大数据能力的不断提升,政府统计产品的种类将会不断丰富,政府统计数据的质量和时效性将会不断提升,从而政府统计服务宏观管理和社会公众的能力会不断提高。
其次,大数据将会推动政府统计发生革命性的变化。随着大数据的发展和完善,随着政府统计机构开发应用大数据技术的逐步成熟,政府统计将会发生革命性变化。一是现有的以周期性普查为基础,以抽样调查为主体,综合运用全面调查、重点调查等方法,并充分利用行政记录等资料的统计调查方法体系可能会发生重大变化。长期以来,抽样调查方法,即在总体中抽选样本、利用样本推算总体的方法;普查和全面调查方法,即对总体中所有单位逐一进行调查的方法,在我国政府统计中发挥了重要作用。今后,在较长的时期内这些方法仍然会被政府统计所广泛采用。但在大数据不断发展和完善的情况下,某些领域、某些方面的大数据可能会取代抽样调查、普查和全面调查方法,成为获取统计数据的重要方法,而且这种获取统计数据的方法将会变得越来越重要。二是政府统计中的数据采集方式可能会发生重大变化。长期以来,政府统计机构主要以企业填报、住户记账、调查员入户等方式采集原始数据。在大数据不断发展和完善的情况下,一部分原始数据将通过挖掘大数据的方式获取,而且这种新的数据采集方式将会变得越来越重要。三是政府统计的数据处理模式可能会发生重大变化。在大数据不断发展和完善的情况下,现行的对普查和全面调查数据进行直接审核、汇总、加工处理和对抽样调查数据进行推算放大的数据处理模式可能会发生重大变化。
(二)大数据给政府统计带来严峻挑战
首先,大数据对政府统计能力带来挑战。从大数据本身的产生到发展完善,从政府统计对大数据的初步运用到成熟运用,需要一个较长的时期。在这个过程中,一方面,政府统计中传统的统计调查方法、数据采集方式和数据处理模式将继续运行,否则满足不了宏观管理和社会公众的需求。另一方面,政府统计系统必须投入大量的人力和物力对大数据进行挖掘、加工处理和运用,否则也适应不了大数据时代宏观管理和社会公众的需求。这种双轨运行的模式,对政府统计能力将是一个巨大的挑战。
其次,大数据对传统政府统计理念带来挑战。传统的政府统计有一个约定俗成的理念:抽样调查方法可降低调查成本,提高效率和数据质量。因为抽样调查只对总体中部分抽中的样本进行调查,并非对总体中的每一个单位都进行调查,所以调查单位明显减少,可降低成本,节约时间,提高效率。同时,由于调查单位较少,政府统计机构有能力对基层统计调查人员进行较为扎实的培训和指导,有精力对统计调查数据进行较为严格的检查和审核,从而能够提高统计调查数据质量。随着大数据不断发展完善,政府统计机构将会越来越多地通过大数据企业间接地获取统计数据,不需要对总体中的具体单位进行直接调查,不需要调查员,从而也不需要对调查员进行培训,抽样调查所具有的调查成本低、能够提高统计调查数据质量的优点就不复存在了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26