京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代需要有人重新定义隐私
随着大数据风生水起,人们对隐私的定义与几年前相比也发生了改变。
国际信息系统审计协会副总裁杰夫·斯皮维认为,随着大数据为我们提供越来越的信息,我们对隐私的定义也将随之演进。
在一次接受信息安全传媒集团的采访中,斯皮维讲到:“与四五年前相比,大数据所代表的含义和随之而来的风险已有所不同,这意味着,企业在收集、使用和分析大量用户数据的同时,必须保证用户的隐私安全。”
在利用大数据的过程中,企业一直面临着数据有效性和准确性的挑战。斯皮维建议,在数据分析过程中,企业和政府机构必须保证最初为保护用户隐私设计的流程不被破坏。
“大数据用一种前所未有的方式让我们以更快的速度了解什么是隐私数据,”斯皮维说道,“一位60岁的老人对隐私的理解与一位从小就与互联网接触的网民是完全不一样的;这场变革已经出现,对隐私的定义也已经改变,并且还在不断发生变化。”
在采访中,斯皮维主要讲到以下三点:
大数据给隐私问题带来的风险;
企业面临的隐私保护方面的挑战;
随着大数据的发展,企业为保护用户隐私应该采取的措施。
斯皮维是国际信息系统审计协会国际副总裁,同时是安全风险管理咨询公司和RiskIQ总裁。斯皮维获得了许多安全资质证书,同时为多家专业杂志撰写文章,曾在多种安全、风险管控、刑事调查和反恐会议中做过主题演讲。
大数据带来的隐私风险问题
记者:大数据给隐私带来了哪些风险?为什么?
斯皮维:如果我们回顾大数据发展的五年多时间就会发现,大数据现在所代表的和我们谈论的风险问题与四五年前已然不同。
由于技术的发展,我们现在可以更快更好的关联数据,这可以为我们提供企业决策洞察力,换句话说可以用数据做决策。随着信息的不断汇集,我们也会越来越了解人,对隐私的定义也会随着大数据的发展而演进。
从风险的角度考虑,以前之所以没有隐私风险是因为技术还不够成熟。我买了一个谷歌Nexus
7平板电脑,在我拿到这个平板电脑的第三天,它就掌握了我的家庭和工作地点。每天在我离开办公室的前五分钟,它就会给我规划一条回家的最佳路线,而不用我输入任何指令信息。从商业角度考虑,数据这种能读懂人和人的行为的能力让商家可以掌握用户的购买习惯,而在这之前,商家只能通过猜测。由于数据收集和数据分析的出现和使用,如果你愿意,我们之前所认为的“隐私数据”也会为你提供一种全新的服务。
隐私概念的演进
记者:您刚才谈到了隐私的演进问题。是隐私定义还是技术本身发展到一定程度使得我们更难定义什么是隐私?
斯皮维:这个问题跟谁定义隐私或对隐私如何理解有关。一位60岁的老人对隐私的理解与一位从小就将所有事件发布在facebook上、与网络共生长的数据原生代是完全不一样的。由于这种变革已经出现,对隐私的理解也已经改变,并且还在不断变化。而技术是推动这场变革的主要原因,它为我们提供了各种各样的数据,它为政府提供全方位数据信息,给企业提供不同的数据集,使企业将具有类似行为、兴趣和购买习惯的用户划分为不同的群体,从而进行精准营销。
目前,欧盟对隐私已经有了不同于美国的全新的定义,一些在美国被认为是隐私的东西在欧盟地区并不认为是隐私。不论从集体角度看还是从个人角度看,隐私概念都在转变。
记者:这种转变在大数据时代与以前有何不同?
斯皮维:大数据可以让我们以更快的速度了解什么才是隐私数据。如果回到美国国家安全局项目之前,回到企业分析用户行为之前,回到之前的分析水平,我们是没有这么多分析工具的。现在有了大数据,这些分析工具可以以更快的速度分析非结构化数据和结构化数据。同样,有了这些分析工具,企业可以利用数据分析做出比之前更好更正确的决策,而且可以预测和控制资源浪费,洞察不同的商业机遇,并基于一定规则选择抓住最利于企业发展的机会。大数据几乎可以让企业做到实时处理各种问题,因为大数据可以实时处理不断变化的数据,企业可以根据数据立即做出决策。
隐私保护面临的挑战
记者:企业在隐私保护方面面临哪些主要挑战?
斯皮维:企业做大数据面临的一个主要挑战是数据的有效性和准确性,企业的一些工作流程最开始设计时是正确的,但在大数据分析过程中,有些数据会涉及用户隐私。确保隐私被保护,同时获得的数据是有效的,并将这两点贯穿于大数据分析过程的始终,是一件颇具挑战的事情。大数据关于隐私保护方面的规则企业都应该去遵守。从安全的角度考虑,我们已经掌握了如何保护静态和流动数据的安全性;但到了大数据时代,我们如何保护数据,如何在大数据演进过程和产品化过程中保护隐私问题,这在某种程度上是一个新的需要探索的课题。
隐私保护的措施
记者:随着大数据的不断深入发展,企业应该采取什么样的措施保护隐私安全?
斯皮维:在大数据时代,企业董事会和管理层会分工协作。董事会研究什么是大数据,大数据有何风险,如何控制风险等,并制定战略;董事会之下是包括CEO在内的公司管理层,他们负责确保数据被保护、并合理利用。如果出现任何异常状况,都会被以适当的方式处理,从而使得大数据发挥最大价值,而不让企业面临风险。
记者:您刚才谈到董事会,大数据时代的CEO职责与过去CEO的职责有何不同吗?
斯皮维:我认为,大数据技术提供了前所未有的分析方法,这对企业来说是一个巨大的机遇。但如果没有综合全面的公司政策和规则指导,大数据也会给企业带来巨大的风险,而企业CEO就是公司的掌舵人。我之前谈到欧洲的法律跟美国的法律不一样,各国的法律都不尽相同。企业CEO 的职责就是辨别公司和组织的风险并控制风险。
记者:请您总结一些您对大数据的看法和思考?
斯皮维:我们的社会将会被越来越多的技术所渗透。新技术会带来新风险,但企业同样也会有处理风险的方法。企业会通过各种方法确定是否值得冒险采用某项新技术。如果值得,风险该如何管理和监控。
有很多企业都是被迫被推动新技术的风头浪尖,跟着新技术的大潮盲目前进。谁将成为驾驭新技术处理风险的典范?采用新技术对企业来说有何回报?我认为,大数据是一个好技术,它将给拥抱大数据理解大数据的企业带来竞争优势,同时,这些企业必须学会如何管理风险。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22