
3 城市大数据分析的保障性措施建议
3.1 与云基地的建设协同发展
各地云基地的建设意味着海量的数据将进行集中管理。其中存储、运算服务伴随云基地的设备到位就可以支持规模性增长,也为大数据分析奠定了基础,而大数据分析也使得多地的云基地建设有最切合的用武之地,不至于成为一朵“浮云”。
3.2 成立城市大数据中心
政府应用数据存在敏感性、保密性等特点,部分甚至涉及国家安全与政府机密,存在较大的管理风险,不便与其他数据混合管理。城市大数据挖掘将整合强大的存储平台和运算系统,综合分析跨地域、跨行业、跨部门的海量数据,而群体事件发现、警情分析等功能需要较快速的反应能力,因此,只有专门的设施与专业的团队配备才能满足这样大规模、高敏捷的需求。
3.3 做好人文保障工作
要做好人文保障工作,必须做到其一是基本的安全问题,必须有系统化的策略进行安全和访问控制。城市数据中心是最让黑客们感兴趣的潜在单点,因而要求最严格的安全。
其二是数据利用方面要小心谨慎,不能滥用。如移动电话数据可以在设备拥有者明确同意后,用于感知交通拥塞,但是不能作为超速驾驶的依据,不能让市民感觉身处“全景监狱”。新模型的使用模式对自愿加入的个人及单位要尽可能透明化,日常分析利用时需确保数据中敏感隐私的剥离。
此外还有许多有待讨论的问题,如是否可以“预测即惩罚”。若通过监控个人的特征和行为发现恐怖分子,那么在恐怖活动未实施之前,能否对看上去证据确凿的某个人实施控制?数据的记忆能力及对数据的接触能力将加深“信息的贫富差距”,如何让大数据走向信息互惠?[2]
3.4 顶层设计中融入大数据理念
未雨绸缪。在系统的建设初期就应该集中考虑标准化、端口与互操作问题。不同的城市,甚至同一城市的不同机构,使用不同的模型管理信息。各个部门若形成信息孤岛,加之大数据中存在的众多半结构化数据、无结构数据,将会进一步导致分析困难。因此在城市信息化的潮流中,应首先进行以大数据为核心的顶层设计[3],瞄准城市基础架构与服务中各利益相关者的需求,并注重标准规范建设。
3.5 解决关键技术问题
从国家近年来政策动向及科技基金来看,非常鼓励大数据产业及相关的研究。各城市也应当在应用、实践的过程中,研究攻克大数据分析中技术方面的问题。
3.5.1 基础技术问题
目前大数据分析所普遍采用的MapReduce分析技术在同等硬件条件下,性能远低于并行数据库;但并行数据库在扩展性、容错性的短板导致其无法“胜任”大数据分析的任务。于是,研究人员致力于整合二者的优点,将诸如Vertica、HadoopDB、Teradata等数据库对MapReduce和并行数据库进行了集成,但解决方案还是基于各方的优缺点进行折衷。例如,HadoopDB能实现关系数据库的高性能和MapReduce的扩展性、容错性,但同时也丧失了MapReduce低预处理代价和维护代价、关系数据库动态数据重分布等正面特性[5]。
3.5.2 传统分析手段改进
目前各领域采集到的数据85%以上是非结构化和半结构化数据[6],但较为成熟的数据分析方法与技术主要还是针对结构化数据的。以舆情分析为例,目前主要还是依赖主题检测和追踪、文本分类、观点倾向性识别、自动摘要等基于文本信息识别的技术。随着非结构化、多样性数据的爆炸式增长,对诸如声音、视频、地理位置等所产生的数据进行综合分析是未来的发展趋势,也是必须攻克的技术难点。
3.5.3 技术人员培养
大数据分析技术人员的缺乏也是制约发展的因素之一。目前数据挖掘、大数据分析行业的分析师比较缺乏,以互联网行业为代表的各大公司展开了人才竞争,而城市级大数据分析要求较高,更增加了对技术人员的职业要求。所以各城市要注重大数据分析师的培养,做好人员准备。
CDA注册数据分析师协会在顺应大数据、云计算的潮流下发起成立的职业简称。旨在加强国内外乃至全球范围内正规化、科学化、专业化的数据分析人才队伍建设,进一步提升数据分析师的职业素养与能力水平,促进数据分析行业的高质量持续快速发展。CDA数据分析师项目包括教育,咨询,考试,认证,机构招聘合作。CDA注册数据分析师协会会员是来自学界、实务界,国内大陆、台湾及国外数据分析和数据挖掘相关领域顶尖的教授、专家.CDA数据分析师的就业前景可选择于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个行业和领域。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04