
不要因为你的误解,对大数据进行妖魔化了
近日,一篇题为《15家数据公司被调查,数据行业面临大清洗?》的微信文章刷爆朋友圈,短短几日,平均阅读1w+的公众号“一本财经”打造出一款10w+的爆文;从该文评论也可以看出大众的不忿和担忧,不知从什么时候开始,我们很难想象“大数据”这个充满科技感的名词会触及到我们的个人隐私。在大数据时代,我们真的还有隐私可言吗?
试想一个场景;“当你在网上购物的时候,你的信息已经悄然地被存储起来、当你在微信里刷朋友圈的时候,你的活动已经被跟踪、当你敲击电脑键盘的时候,电脑程序记录下你的键盘操控过程、当你走在大街上的时候,有无数监控摄像头正冷冷地盯着你....”我们可以想的更加大胆一些;当你一直不清在酒酣耳热之后讲的那些愚蠢的话,转眼间就会在网络上被人疯传。我的天啊!!!如果这一天真的来到,我恐怕只能安慰自己说“你的隐私只剩零了,想开点吧。”
难道“大数据”就真的这么恐怖?我不否认现在很多大数据公司,披着大数据的外衣,干着倒卖个人信息的勾当。“在2016年8月,山东考生徐玉玉遭遇电信诈骗,9900元学费被骗走后不幸离世、2017年2月16日,信息贩子公然叫嚣,只要一个手机号码就能查到最私密的个人信息,且范围覆盖全国。”这类现象比比皆是,社会舆论直指个人信息泄露。
当社会对大数据公司开始慢慢地妖魔化,我想这未免对这个大数据行业有了很深的误解。社会大众可能并不知道大数据公司到底在做什么?上面提到的隐私泄露、黑市交易等现象都不是真正意义上的大数据公司。
大数据公司究竟在做什么?
对于“大数据”,研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。维基百科的定义,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。简单来说,大数据具有4个特点特点:大量、高速、多样、价值。
可能抽象的定义很难去理解大数据,至于大数据公司究竟是干什么的更是没有明确的定义。下面是利用“大数据”去分析的一个小案例。在这一场景下,我们根本不会涉及到个人信息。
这是“一本财经”在黑市内发现的车管所数据,我们一起大胆猜想一下这些数据有哪些用途:保险公司会定时给你推销各种品类的保险;销售公司会判断你大概什么时间要换车了,时间一到,立马会为你推销汽车广告;中介可以将数据卖给征信风控企业等一系列个人信息被泄露的现象。这些是某些大数据公司披着大数据的外衣,干着倒卖个人信息的勾当。这是个别的特例,是整个大数据行业所鄙视的行为。
一家大数据公司真正做的是把车主的信息进行脱敏处理的,我们不需车主的姓名,身份信息,手机号,保险到期时间等关键信息,只通过车辆型号,所有者年龄、性别等信息,利用大数据技术得到车主的整体画像。
如上,我们得出的数据分析报告是某个时间段内自主品牌汽车行业的相关情况,完全不会涉及侵犯个人隐私。我们利用“脱敏后的数据”进行分析,得到的是整个宏观的数据分析结果,这个数据报告将会对汽车厂商的设计、生产、营销推广均有不同程度的指导作用。
通过上面两个图片的对比,我们不难看出,利用大数据做的是一个不断优化的生态系统,大数据的真正价值在于挖掘,也就是洞察数据之间的关联,通过对比、交叉、相关、聚类等等方法,得出可视化的分析结果。基于结果洞察到新的机会点、预测未来趋势,得出一套科学合理的解决方案”。
所以开篇所提到的那15家数据公司所做的“公民隐私信息交易问题”,在整个数据分析中是根本不会涉及的。我们利用大数据想要的是一个宏观的趋势,而不是仅仅局限在个人的隐私上面。我相信在《网络安全法》正式实施之后,数据行业的风气将为之一新,以往在“灰色”领域不具备竞争优势的企业,将会脱颖而出,迎来绝佳的发展机会。
数据安全
“随着物联网的发展,在未来一切东西都会智能化、都在线上,社会上对于数据安全的呼声越来越高,需求也是越来越强烈。”今年5月,新型“蠕虫”式勒索病毒席卷全球,网络安全已成为政府部门、企业机构、社会大众共同关注的热点话题。27日,“大数据网络应用安全技术高峰论坛”在贵阳国际生态会议中心举行。业界专家大咖汇聚一堂,聚焦大数据基础系统,为营造安全和谐的网络环境建言献策。
6月1日,《中华人民共和国网络安全法》的正式实施,成为我国网络空间法治建设的重要里程碑,在确立安全在整个信息系统建设中的核心和关键地位的同时,对保护公众个人信息安全也起到积极作用。
由此可见,不管是从国家层面,还是个人层面,数据安全问题都是发展的核心问题。在风起云涌的大数据时代,我们每个人都很难做到独善其身,在推动数据应用时所面临的风险与挑战,需要国家和企业一起努力。
大数据浪潮势不可挡
数据已成为国家基础性战略资源和商业创新源泉,深化大数据应用成为世界各国和产业界的一致选择。全球数据规模持续迅猛增长,数据被认为是新时代基础生活资料与市场生产要素,成为了全球“互联网+”变革浪潮下的基础“能源”,战略价值不亚于工业社会的石油。
工信部发布的《中国大数据发展调查报告(2017年)》中显示,2016年中国大数据市场整体规模为168.0亿元,较2015年增速达45%,预计2017-2020年增速将保持在30%以上,意味着在未来3年,我国大数据市场的整体规模将来到500亿。
同样在报告的调查中显示,59.2%的受访企业已成立数据分析相关部门,35.1%的企业已经应用了大数据,大数据应用得到进一步普及;目前大数据应用最为广泛的三个领域分别为营销分析、客户分析和内部运营管理。
目前,我国大数据市场的供给结构已经初步形成,大数据创新应用深入经济社会各领域。大数据成为服务经济社会民生的重要支撑和引领产业转型升级的核心力量。在广大现有和新兴细分市场中,大数据市场融合技术与服务,正形成迅猛的发展势头。未来几年大数据市场仍将呈现强劲的增长,风头势不可挡。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
剖析 CDA 数据分析师考试题型:解锁高效备考与答题策略 CDA(Certified Data Analyst)数据分析师考试作为衡量数据专业能力的 ...
2025-07-04SQL Server 字符串截取转日期:解锁数据处理的关键技能 在数据处理与分析工作中,数据格式的规范性是保证后续分析准确性的基础 ...
2025-07-04CDA 数据分析师视角:从数据迷雾中探寻商业真相 在数字化浪潮席卷全球的今天,数据已成为企业决策的核心驱动力,CDA(Certifie ...
2025-07-04CDA 数据分析师:开启数据职业发展新征程 在数据成为核心生产要素的今天,数据分析师的职业价值愈发凸显。CDA(Certified D ...
2025-07-03从招聘要求看数据分析师的能力素养与职业发展 在数字化浪潮席卷全球的当下,数据已成为企业的核心资产,数据分析师岗位也随 ...
2025-07-03Power BI 中如何控制过滤器选择项目数并在超限时报错 引言 在使用 Power BI 进行数据可视化和分析的过程中,对过滤器的有 ...
2025-07-03把握 CDA 考试时间,开启数据分析职业之路 在数字化转型的时代浪潮下,数据已成为企业决策的核心驱动力。CDA(Certified Da ...
2025-07-02CDA 证书:银行招聘中的 “黄金通行证” 在金融科技飞速发展的当下,银行正加速向数字化、智能化转型,海量数据成为银行精准 ...
2025-07-02探索最优回归方程:数据背后的精准预测密码 在数据分析和统计学的广阔领域中,回归分析是揭示变量之间关系的重要工具,而回 ...
2025-07-02CDA 数据分析师报考条件全解析:开启数据洞察之旅 在当今数字化浪潮席卷全球的时代,数据已成为企业乃至整个社会发展的核心驱 ...
2025-07-01深入解析 SQL 中 CASE 语句条件的执行顺序 在 SQL 编程领域,CASE语句是实现条件逻辑判断、数据转换与分类的重要工 ...
2025-07-01SPSS 中计算三个变量交集的详细指南 在数据分析领域,挖掘变量之间的潜在关系是获取有价值信息的关键步骤。当我们需要探究 ...
2025-07-01CDA 数据分析师:就业前景广阔的新兴职业 在当今数字化时代,数据已成为企业和组织决策的重要依据。数据分析师作为负责收集 ...
2025-06-30探秘卷积层:为何一个卷积层需要两个卷积核 在深度学习的世界里,卷积神经网络(CNN)凭借其强大的特征提取能力 ...
2025-06-30探索 CDA 数据分析师在线课程:开启数据洞察之旅 在数字化浪潮席卷全球的当下,数据已成为企业决策、创新与发展的核心驱 ...
2025-06-303D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32% 编辑:LRST 【新智元导读】中科院自动化所提出BridgeVLA模型,通过将 ...
2025-06-30LSTM 为何会产生误差?深入剖析其背后的原因 在深度学习领域,LSTM(Long Short-Term Memory)网络凭借其独特的记忆单元设 ...
2025-06-27LLM进入拖拽时代!只靠Prompt几秒定制大模型,效率飙升12000倍 【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新 ...
2025-06-27探秘 z-score:数据分析中的标准化利器 在数据的海洋中,面对形态各异、尺度不同的数据,如何找到一个通用的标准来衡量数据 ...
2025-06-26Excel 中为不同柱形设置独立背景(按数据分区)的方法详解 在数据分析与可视化呈现过程中,Excel 柱形图是展示数据的常用工 ...
2025-06-26