
不要因为你的误解,对大数据进行妖魔化了
近日,一篇题为《15家数据公司被调查,数据行业面临大清洗?》的微信文章刷爆朋友圈,短短几日,平均阅读1w+的公众号“一本财经”打造出一款10w+的爆文;从该文评论也可以看出大众的不忿和担忧,不知从什么时候开始,我们很难想象“大数据”这个充满科技感的名词会触及到我们的个人隐私。在大数据时代,我们真的还有隐私可言吗?
试想一个场景;“当你在网上购物的时候,你的信息已经悄然地被存储起来、当你在微信里刷朋友圈的时候,你的活动已经被跟踪、当你敲击电脑键盘的时候,电脑程序记录下你的键盘操控过程、当你走在大街上的时候,有无数监控摄像头正冷冷地盯着你....”我们可以想的更加大胆一些;当你一直不清在酒酣耳热之后讲的那些愚蠢的话,转眼间就会在网络上被人疯传。我的天啊!!!如果这一天真的来到,我恐怕只能安慰自己说“你的隐私只剩零了,想开点吧。”
难道“大数据”就真的这么恐怖?我不否认现在很多大数据公司,披着大数据的外衣,干着倒卖个人信息的勾当。“在2016年8月,山东考生徐玉玉遭遇电信诈骗,9900元学费被骗走后不幸离世、2017年2月16日,信息贩子公然叫嚣,只要一个手机号码就能查到最私密的个人信息,且范围覆盖全国。”这类现象比比皆是,社会舆论直指个人信息泄露。
当社会对大数据公司开始慢慢地妖魔化,我想这未免对这个大数据行业有了很深的误解。社会大众可能并不知道大数据公司到底在做什么?上面提到的隐私泄露、黑市交易等现象都不是真正意义上的大数据公司。
大数据公司究竟在做什么?
对于“大数据”,研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。维基百科的定义,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。简单来说,大数据具有4个特点特点:大量、高速、多样、价值。
可能抽象的定义很难去理解大数据,至于大数据公司究竟是干什么的更是没有明确的定义。下面是利用“大数据”去分析的一个小案例。在这一场景下,我们根本不会涉及到个人信息。
这是“一本财经”在黑市内发现的车管所数据,我们一起大胆猜想一下这些数据有哪些用途:保险公司会定时给你推销各种品类的保险;销售公司会判断你大概什么时间要换车了,时间一到,立马会为你推销汽车广告;中介可以将数据卖给征信风控企业等一系列个人信息被泄露的现象。这些是某些大数据公司披着大数据的外衣,干着倒卖个人信息的勾当。这是个别的特例,是整个大数据行业所鄙视的行为。
一家大数据公司真正做的是把车主的信息进行脱敏处理的,我们不需车主的姓名,身份信息,手机号,保险到期时间等关键信息,只通过车辆型号,所有者年龄、性别等信息,利用大数据技术得到车主的整体画像。
如上,我们得出的数据分析报告是某个时间段内自主品牌汽车行业的相关情况,完全不会涉及侵犯个人隐私。我们利用“脱敏后的数据”进行分析,得到的是整个宏观的数据分析结果,这个数据报告将会对汽车厂商的设计、生产、营销推广均有不同程度的指导作用。
通过上面两个图片的对比,我们不难看出,利用大数据做的是一个不断优化的生态系统,大数据的真正价值在于挖掘,也就是洞察数据之间的关联,通过对比、交叉、相关、聚类等等方法,得出可视化的分析结果。基于结果洞察到新的机会点、预测未来趋势,得出一套科学合理的解决方案”。
所以开篇所提到的那15家数据公司所做的“公民隐私信息交易问题”,在整个数据分析中是根本不会涉及的。我们利用大数据想要的是一个宏观的趋势,而不是仅仅局限在个人的隐私上面。我相信在《网络安全法》正式实施之后,数据行业的风气将为之一新,以往在“灰色”领域不具备竞争优势的企业,将会脱颖而出,迎来绝佳的发展机会。
数据安全
“随着物联网的发展,在未来一切东西都会智能化、都在线上,社会上对于数据安全的呼声越来越高,需求也是越来越强烈。”今年5月,新型“蠕虫”式勒索病毒席卷全球,网络安全已成为政府部门、企业机构、社会大众共同关注的热点话题。27日,“大数据网络应用安全技术高峰论坛”在贵阳国际生态会议中心举行。业界专家大咖汇聚一堂,聚焦大数据基础系统,为营造安全和谐的网络环境建言献策。
6月1日,《中华人民共和国网络安全法》的正式实施,成为我国网络空间法治建设的重要里程碑,在确立安全在整个信息系统建设中的核心和关键地位的同时,对保护公众个人信息安全也起到积极作用。
由此可见,不管是从国家层面,还是个人层面,数据安全问题都是发展的核心问题。在风起云涌的大数据时代,我们每个人都很难做到独善其身,在推动数据应用时所面临的风险与挑战,需要国家和企业一起努力。
大数据浪潮势不可挡
数据已成为国家基础性战略资源和商业创新源泉,深化大数据应用成为世界各国和产业界的一致选择。全球数据规模持续迅猛增长,数据被认为是新时代基础生活资料与市场生产要素,成为了全球“互联网+”变革浪潮下的基础“能源”,战略价值不亚于工业社会的石油。
工信部发布的《中国大数据发展调查报告(2017年)》中显示,2016年中国大数据市场整体规模为168.0亿元,较2015年增速达45%,预计2017-2020年增速将保持在30%以上,意味着在未来3年,我国大数据市场的整体规模将来到500亿。
同样在报告的调查中显示,59.2%的受访企业已成立数据分析相关部门,35.1%的企业已经应用了大数据,大数据应用得到进一步普及;目前大数据应用最为广泛的三个领域分别为营销分析、客户分析和内部运营管理。
目前,我国大数据市场的供给结构已经初步形成,大数据创新应用深入经济社会各领域。大数据成为服务经济社会民生的重要支撑和引领产业转型升级的核心力量。在广大现有和新兴细分市场中,大数据市场融合技术与服务,正形成迅猛的发展势头。未来几年大数据市场仍将呈现强劲的增长,风头势不可挡。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
KS 曲线不光滑:模型评估的隐形陷阱,从原因到破局的全指南 在分类模型(如风控违约预测、电商用户流失预警、医疗疾病诊断)的评 ...
2025-08-19偏态分布:揭开数据背后的非对称真相,赋能精准决策 在数据分析的世界里,“正态分布” 常被视为 “理想模型”—— 数据围绕均值 ...
2025-08-19CDA 数据分析师:数字化时代的价值创造者与决策智囊 在数据洪流席卷全球的今天,“数据驱动” 已从企业战略口号落地为核心 ...
2025-08-19CDA 数据分析师:善用 Power BI 索引列,提升数据处理与分析效率 在 Power BI 数据分析流程中,“数据准备” 是决定后续分析质量 ...
2025-08-18CDA 数据分析师:巧用 SQL 多个聚合函数,解锁数据多维洞察 在企业数据分析场景中,单一维度的统计(如 “总销售额”“用户总数 ...
2025-08-18CDA 数据分析师:驾驭表格结构数据的核心角色与实践应用 在企业日常数据存储与分析场景中,表格结构数据(如 Excel 表格、数据库 ...
2025-08-18PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12