京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据创新信息化测评方法
目前信息化评测方法基本上是从传统的统计方法延续过来的,其数据主要来自两个方面:各地区政府管理部门上报数据和有关部门的抽样调查。但是,这两种数据来源对于评价地区信息化水平来说,都存在一定的问题。
政府部门提供的数据容易偏重于建设方面,如信息化建设投资了多少、铺设了多少皮长公里光纤、建设了多少数据库、存储了多少数据资源等等,这些数据只能反映政府在信息化建设上做了多少工作,而不能反映信息化的应用效果;利用抽样调查取得的数据也有问题,原因在于样本很难随机抽样、问卷设计难以规范、用户回答的随意性太大,满意度很难作为客观的评价指标。
同时,在评测信息化水平的指标选择上也存在一些问题:指标陈旧、更新不及时、跟不上信息技术环境的变化等。例如移动互联网、电子商务、云计算、物联网等应用很难纳入统计。
总之,传统的统计方式适合于纵向历史数据比较,很难适应以横向比较为主的快速变化的信息化形势。为了能够相对客观地比较各地区信息化发展水平,应当尽量使用一些计算机产生的数据,减少人为随意性带来的不确定性。因此,对于信息化的评测,需要另辟蹊径。
利用大数据方法获取数据
应当看到,地区的信息化水平并不等于信息化建设投资的规模,也不等于信息系统能够提供的功能。城市的信息化水平主要是指信息化应用的普及率、应用深度及应用效益水平。信息化应用水平,尤其是应用效益是不可控的,政府可以建设许多项目,但公众是否愿意使用则是另一回事。应用普及是公众的自主选择的结果,一项对公众帮助不大的服务,用户肯定门可罗雀,用户规模更能反映信息化建设的效果。城市信息化水平的调查重点应当是应用规模。注重最终用户效益的统计调查,有利于管理者重视整体效益,重视各方面环境的配套,也有益于智慧的城市建设。
为提高数据获取的效率、增加数据的客观性,我们应当充分利用大数据的方法对传统方法进行改进。信息技术普及到今天,很多应用数据都能够通过自动化的渠道来获取,需要选择的指标不需要太多,多则惑,少则得。GDP之所以受到人们的关注,最重要的原因就是简单。因此,信息化的评测数据也要力求简单,便于普及与推广,只要能够说明问题,指标数目少一些更好。
大数据可以有以下几个来源:搜索网站(如百度)、信用卡公司(如银联)、电子商务公司(如阿里巴巴)、运营商(三大运营商均可)以及可提供政府网站点击率、市民卡使用率的机构。这些企业与机构提供的数据都是由计算机自动生成的,没有人为干预,数据规范而客观,对于评价地区信息化发展水平是很好的参考资料。
五大参数反映信息化水平
从数据获取的难易性和客观真实性出发考虑,笔者建议利用五大“利用率”指标来评测一个地方的信息化发展水平,这5个利用率分别是信息资源利用率、智能设施利用率、通信设施利用率、政府网站利用率和电子商务利用率。
信息资源利用率:主要数据来源是百度的搜索引擎,可以方便地统计出全国每一地区的搜索量,得出各地区网民的平均信息资源的利用能力,内容可进一步分为信息类、娱乐类、电子商务类。
智能设施利用率:包括银行卡刷卡量、市民卡刷卡量、交通卡刷卡量。这三类数据都较容易获取,人均智能卡使用率能够比较准确地反映城市智能设施的应用效果。
通信设施利用率:主要是地区通信数量,包括3G通信的比例,人均通信量越高的城市,信息化水平越高。通信量还包括城市进出人口的通信统计,可以反映城市人口的流动率,人口流动率也是反映城市信息化水平的重要数据。
政府网站利用率:政府网站点击率能够反映政府电子政务被使用的效果,电子政务网站向城市居民渗透率是评价电子政务效果的重要指标,这个数据并不难得到,分析这些数据对电子政务改进很有价值。
电子商务利用率:电子商务利用率也是评价一个地区信息化水平的重要指标,该数据可以向阿里巴巴订购,可以比较一个城市的电子商务普及率、物流覆盖率、居民消费能力,电子商务统计数据对于比较各地信息化水平十分重要。
上述数据除以地区人口数,即得到相应的信息化参数值。这些数据都是来自计算机的自动统计,在通过数据分析师的进一步整理,因而有着更好的客观性。如果有机构能够将这些数据组织为完整的系统向全国发布,对于各地政府的智慧城市建设会有很大帮助;而承担这项工作的机构有无行政权力并不重要,重要的是创意与合作能力,政府、民间都可以做,或许民间机构会做得更好。
将各地区信息化数据加工成为一个指数来进行信息化统一排名的必要性不是很大,因为各地区环境差异太大。但是,分类的排序却很有好处,有助于各地区看到具体的差距,以便于改进。将这五个参数用雷达图表达会更加直观,从雷达图上可以看出本地区信息化发展的薄弱环节,有助于地方政府改进工作。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11在CDA(Certified Data Analyst)数据分析师的实操体系中,统计基本概念是不可或缺的核心根基,更是连接原始数据与业务洞察的关 ...
2026-02-11在数字经济飞速发展的今天,数据已成为核心生产要素,渗透到企业运营、民生服务、科技研发等各个领域。从个人手机里的浏览记录、 ...
2026-02-10在数据分析、实验研究中,我们经常会遇到小样本配对数据的差异检验场景——比如同一组受试者用药前后的指标对比、配对分组的两组 ...
2026-02-10在结构化数据分析领域,透视分析(Pivot Analysis)是CDA(Certified Data Analyst)数据分析师最常用、最高效的核心实操方法之 ...
2026-02-10在SQL数据库实操中,字段类型的合理设置是保证数据运算、统计准确性的基础。日常开发或数据分析时,我们常会遇到这样的问题:数 ...
2026-02-09在日常办公数据分析中,Excel数据透视表是最常用的高效工具之一——它能快速对海量数据进行分类汇总、分组统计,将杂乱无章的数 ...
2026-02-09表结构数据作为结构化数据的核心载体,其“获取-加工-使用”全流程,是CDA(Certified Data Analyst)数据分析师开展专业工作的 ...
2026-02-09在互联网产品运营、用户增长的实战场景中,很多从业者都会陷入一个误区:盲目投入资源做推广、拉新,却忽视了“拉新后的用户激活 ...
2026-02-06在机器学习建模过程中,特征选择是决定模型性能的关键环节——面对动辄几十、上百个特征的数据(如用户画像的几十项维度、企业经 ...
2026-02-06在CDA(Certified Data Analyst)数据分析师的日常实操中,表格结构数据是贯穿全流程的核心载体,而对表格数据类型的精准识别、 ...
2026-02-06在日常办公数据分析中,我们经常会面对杂乱无章的批量数据——比如员工月度绩效、产品销售数据、客户消费金额、月度运营指标等。 ...
2026-02-05