京公网安备 11010802034615号
经营许可证编号:京B2-20210330
三规划五能力政府大数据落地找到方法了
在多个场合我们都听过到这样的声音,政府是拥有大数据最多的机构,很多的企业人士以及CIO都在呼吁政府能够开放大数据,但对于政府而言,究竟该怎么开放大数据,怎么让大数据更接“地气”?似乎大家都还没有彻底想明白。
政府大数据“落地”难点
对于大数据的重要性,已经不言喻,自今年9月国务院发布了《关于促进大数据发展的行动纲要》(以下简称纲要)以来,大数据已经成为国家的一个战略。在这样的背景下,政府数据就显得更为重要,尤其是政府部门间的数据共享、公共数据的资源开放以及大数据基础设施建设等是很多问题有待解决完善。
普元信息CTO焦烈焱认为,政府是非常好的大数据应用场所,而且政府的数据是最全、最多、最杂也最能发挥效应。政府可通过大数据做社会治理、企业监督等,同时,能够为社会的发展提供基础或者帮助。但是,政府做大数据面临着不少的挑战,主要两个层面:第一、业务管理。第二、技术瓶颈。比如在信息共享方面通常是说得简单实际很难;在数据开放方面需要开放但又不希望暴露隐私。
通常提到大数据首先会想到的是淘宝、京东、百度,但它们的大数据分析是围绕人的行为来做,政府则不仅要关注人同时还要关注多个维度,而且政府关注大数据并不只关注技术,也关注数据质量提高。
三规划 五能力 政务大数据落地方法!
面对政府落地大数据的挑战以及大环境的机遇,普元信息抓住“契机”,从2011年开始,专业研究政府大数据落地的问题,经过在各方面探索、经验下,总结出在政府数据领域中的解决方案和实施方法,帮助政府全面掌控与运营政务大数据。
在整个数据的产生到消费包括服务运营模式,普元信息为其提供了整体规划,帮助政府开展大数据业务比如贵阳的大数据平台、武汉大数据平台,这些都是鲜活的例子。具体来看政府做大数据的要有三阶段的规划,来自普元信息副总裁王克强对此作了详细的介绍,他指出,:第一,共享共用;
先拥有数据然后在解决数据标准问题,在新一代数据的共享和集成过程中面临的挑战在如何把不同类型的数据进行有效的集成。普元信息建立了有效应对多种数据源、不同数据类型、不同协议,统一数据支撑能力,同时,解决高容量、大并发、海量数据的交换集成的能力。有了数据交换共享很好地解决了有数据,建立了行业数据中心,政府会在多级部门之间建立以市省部三级数据为主的体系,建立起有效的数据共享和能力。同时普元信息也会把金融对数据严谨管理水平带到政务应用中使得政务数据越来越准确,越来越有效,这是在数据共享阶段中的关键目标。
第二,开放服务
在共享共用前提下,数据要支撑整个社会发展必须要把数据“开放”出去。面对不同领域数据如何有效的管理并统一调度使用?重要的就是通过数据的整合能力开放给社会。其主要挑战在于会有多源的数据进行整理而且不知道如何开放给社会。“脱敏”能够清晰地知道数据采用什么样的形式、方法开放给社会,向社会开放政务的所有的能力。普元信息能够对多个领域的数据进行有效管理,而有效管理的核心是最终支撑高效和统一的开放。
第三,融合。
有了开放,数据要做融合应用,要真正的使数据发挥最大的价值需要支撑大量应用能力。首先要做全端数据可视化最终形成基于数据驱动的精确分析的行为。通过数据挖掘行为找出大量可用数据信息形成新的融合应用,用数据驱动业务,实现可视化的监管体系。当这些做完后,可以有效地把数据推向整个社会、融合社会产业的能力,最终把数据开放给社会。普元信息在融合中以互联网创新的能力推动整个政务大数据平台的生态,有效地推动数据有效融合起来,最终给未来的数据提供更好的平台的能力。
除了三大规划以后,政府大数据落地还应注重五大能力,普元信息大数据产品线总经理王轩指出,随着大数据、物联网的到来,数据的采集和过去有很大的不同,数据已经成为其企业应用系统的核心,而且应用系统是围绕大数据去建设。以电力系统为例中,过去的数据是靠人工录入但是现在采用智能电表以后,能够每5分钟采集数据,然后收集数据进行分析、营销,实际上,整个数据部分已经成为了电力营销系统核心的组成部分。但是这样采集的数据量会非常大,原有的应用系统架构已经很难满足业务需求,因此,需要对原有应用系统提供整套大数据架构,帮助业务系统把业务做的更好,适应现在的需求。
另外,通常电力应用系统非常复杂,它也需要有一套数据监控机制,在整个数据的链路上做数据标准真正数据的过程监控好,同时也需要做数据治理,分析挖掘利用数据。
普元的大数据平台具备五大核心能力:数据集成能力、数据存储能力、数据应用平台、治理数据、数据运营监控。
普元信息提供整个数据集成部分,把数据准确、高质量、高效率的放到存储之中,同时,提供一整套大数据存储的能力。当面对大规模数据采集,普元信息提供得是大规模分布式的架构,这保证应用系统最大的运行效率,同时,保证安全性。在数据质量方面采用多层缓存技术,使得能够拥有数据,处理数据发现问题。
某人寿企业拥有海量的数据,在运行数据时通常需14个小时才能够完成一天的数据量,也就是说凌晨开始运行数据真正要看到结果要在第二天的下午,这严重影响了效率。“采用分布式处理,把批量的ETL处理变成单条处理,让它能快速的分布在多个线程之中同时去运行,用几百台机器同时批量运行完,这种极大的提高了效率。”
另外,普元信息还提供了完整大数据治理解决方案,在大数据时代很重要的是数据质量是不高的问题,普元信息大数据治理解决方案通过数据标准的建立,促进数据质量的整改,提供原数据技术基础,并且把监控和开放作为组成部分。
总体来看,普元信息化整个大数据平台具备以下特征:第一,存储处理是根基。第二,数据质量是底线。通过数据治理促进数据质量的提升。第三,共享共用是关键。通过数据集成,数据治理达到数据能够共享和开放。第四,数据开放是趋势。我们需要有整个数据开放的能力去做支撑。第五,融合应用是目标。通过自助式数据的应用的能力,完成整个融合应用部分。
小结
在大数据领域 ,其实已经有众多的服务商,那么普元信息在政府大数据的领域的优势在于哪些方面?对于此,我们了解到普元信息依托于运营商、金融领域的大数据经验并且通过开放平台架构能力,普元信息相信能够真正帮助政府大数据“落地”,最终能够让社会化产生更好的使用。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15