京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据创新信息化测评方法
目前信息化评测方法基本上是从传统的统计方法延续过来的,其数据主要来自两个方面:各地区政府管理部门上报数据和有关部门的抽样调查。但是,这两种数据来源对于评价地区信息化水平来说,都存在一定的问题。
政府部门提供的数据容易偏重于建设方面,如信息化建设投资了多少、铺设了多少皮长公里光纤、建设了多少数据库、存储了多少数据资源等等,这些数据只能反映政府在信息化建设上做了多少工作,而不能反映信息化的应用效果;利用抽样调查取得的数据也有问题,原因在于样本很难随机抽样、问卷设计难以规范、用户回答的随意性太大,满意度很难作为客观的评价指标。
同时,在评测信息化水平的指标选择上也存在一些问题:指标陈旧、更新不及时、跟不上信息技术环境的变化等。例如移动互联网、电子商务、云计算、物联网等应用很难纳入统计。
总之,传统的统计方式适合于纵向历史数据比较,很难适应以横向比较为主的快速变化的信息化形势。为了能够相对客观地比较各地区信息化发展水平,应当尽量使用一些计算机产生的数据,减少人为随意性带来的不确定性。因此,对于信息化的评测,需要另辟蹊径。
利用大数据方法获取数据
应当看到,地区的信息化水平并不等于信息化建设投资的规模,也不等于信息系统能够提供的功能。城市的信息化水平主要是指信息化应用的普及率、应用深度及应用效益水平。信息化应用水平,尤其是应用效益是不可控的,政府可以建设许多项目,但公众是否愿意使用则是另一回事。应用普及是公众的自主选择的结果,一项对公众帮助不大的服务,用户肯定门可罗雀,用户规模更能反映信息化建设的效果。城市信息化水平的调查重点应当是应用规模。注重最终用户效益的统计调查,有利于管理者重视整体效益,重视各方面环境的配套,也有益于智慧的城市建设。
为提高数据获取的效率、增加数据的客观性,我们应当充分利用大数据的方法对传统方法进行改进。信息技术普及到今天,很多应用数据都能够通过自动化的渠道来获取,需要选择的指标不需要太多,多则惑,少则得。GDP之所以受到人们的关注,最重要的原因就是简单。因此,信息化的评测数据也要力求简单,便于普及与推广,只要能够说明问题,指标数目少一些更好。
大数据可以有以下几个来源:搜索网站(如百度)、信用卡公司(如银联)、电子商务公司(如阿里巴巴)、运营商(三大运营商均可)以及可提供政府网站点击率、市民卡使用率的机构。这些企业与机构提供的数据都是由计算机自动生成的,没有人为干预,数据规范而客观,对于评价地区信息化发展水平是很好的参考资料。
五大参数反映信息化水平
从数据获取的难易性和客观真实性出发考虑,笔者建议利用五大“利用率”指标来评测一个地方的信息化发展水平,这5个利用率分别是信息资源利用率、智能设施利用率、通信设施利用率、政府网站利用率和电子商务利用率。
信息资源利用率:主要数据来源是百度的搜索引擎,可以方便地统计出全国每一地区的搜索量,得出各地区网民的平均信息资源的利用能力,内容可进一步分为信息类、娱乐类、电子商务类。
智能设施利用率:包括银行卡刷卡量、市民卡刷卡量、交通卡刷卡量。这三类数据都较容易获取,人均智能卡使用率能够比较准确地反映城市智能设施的应用效果。
通信设施利用率:主要是地区通信数量,包括3G通信的比例,人均通信量越高的城市,信息化水平越高。通信量还包括城市进出人口的通信统计,可以反映城市人口的流动率,人口流动率也是反映城市信息化水平的重要数据。
政府网站利用率:政府网站点击率能够反映政府电子政务被使用的效果,电子政务网站向城市居民渗透率是评价电子政务效果的重要指标,这个数据并不难得到,分析这些数据对电子政务改进很有价值。
电子商务利用率:电子商务利用率也是评价一个地区信息化水平的重要指标,该数据可以向阿里巴巴订购,可以比较一个城市的电子商务普及率、物流覆盖率、居民消费能力,电子商务统计数据对于比较各地信息化水平十分重要。
上述数据除以地区人口数,即得到相应的信息化参数值。这些数据都是来自计算机的自动统计,在通过数据分析师的进一步整理,因而有着更好的客观性。如果有机构能够将这些数据组织为完整的系统向全国发布,对于各地政府的智慧城市建设会有很大帮助;而承担这项工作的机构有无行政权力并不重要,重要的是创意与合作能力,政府、民间都可以做,或许民间机构会做得更好。
将各地区信息化数据加工成为一个指数来进行信息化统一排名的必要性不是很大,因为各地区环境差异太大。但是,分类的排序却很有好处,有助于各地区看到具体的差距,以便于改进。将这五个参数用雷达图表达会更加直观,从雷达图上可以看出本地区信息化发展的薄弱环节,有助于地方政府改进工作。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20