京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代,保护用户数据不能因噎废食
进入“大数据时代”之后,用户数据愈发暴露在“阳光下”,我们可以清楚地看到用户在互联网上的一些行为几乎都会被服务提供方知晓。就像淘宝、亚马逊监视着我们的购物习惯、Google监视着我们浏览网页的习惯,微博了解我们的信中所好,滴滴打车知道我们每天出行的时间的地点,微信似乎什么都知道,包括我们的社交关系和消费能力。而多维度数据结合起来,几乎可以构建出关于一个互联网原住民的一切信息。
但我们是否就要据此放弃给生活带来无限便捷的互联网产品?答案显然是否定的。保护个人隐私不能因噎废食。大数据的年代,个人隐私问题肯定会更集中,但不能因为有风险就拒绝大数据,就像不能因为菜刀可以砍人,就不允许用了是一个道理。
对互联网企业来讲,从用户那里收集到的信息主要包括消费习惯、行为特征、个人数据等,企业可以通过收集这些信息去开展大数据分析,进一步挖掘用户的潜在消费能力,更多元化的价值,从而为用户提供更有针对性的服务。在这个前提下,消费者或用户也许可以让渡一定的个人隐私。
同时,风口浪尖上的Windows 10发言人也表述,任何与微软分享的数据,都将有消费者自己决定。换言之,微软不会在任何未经许可的情况下收集用户数据。
用户能做些什么
虽然微软称是否与微软分享数据由用户自身决定,但Windows 10很多数据收集机制都是默认开启的。因此我们要明确在什么地方可以关闭,并且是否会影响系统功能?
最活跃的数据收集应用是虚拟助理Cortana。她可以跟踪记录你的网页搜索记录,查看邮件知道你的偏好与日程安排。大部分这类信息都存储在一个可编辑的“记事本”中,这个选项在打开Cortana后便可发现。微软的必应搜索引擎也会存储信息,用户可以点击“设置”——“Manage what Cortana knows about me in the cloud”进行清除,或者直接前往bing.com/account/personalization调整。
微软表示,公司会用“多种安全技术与流程”保护Cortana收集到的数据。这些数据在传输到微软时是加密的。但执法机构和政府部门也可能会强制微软交出部分数据。
如果不想微软涉入个人生活,你可以选择不要把Windows 10与微软帐号连接起来(在安装过程中,当被要求用微软帐号登陆时,选择“创建新账户”以及“不用微软帐号登录”)这种情况下,Windows 10的搜索框仍然有效,但Cortana在没有微软帐号的情况下无法使用。内置的反病毒软件仍然可用。
即便不用微软帐号登录,Windows 10也可能会以其他很多方式收集数据。尤其是Edge浏览器将必应作为默认搜索引擎,这可以跟踪一些活动(如果不登录就是匿名的),并会让用户看到有针对性的广告。进入choice.microsoft.com调整,用户可以选择停用广告追踪。Edge还会预判你要看的网页,从而提前加载你可能点击的网页。可以在Edge的设置中关掉这一功能。
在Windows的设置菜单中,还有很多其他关于隐私的开关。这其中包括微软接受并分享有关用户电脑UID、地理位置、麦克风、摄像头的种种信息,甚至还包括输入习惯。如果使用Windows 10的快速安装,那么所有这些设置都是默认开启的。在“设置”菜单中,用户也可以限定具体应用对这些功能的使用。
关于WiFi密码分享工具
Windows 10中一个名叫“WiFi Sense”的功能也有些令人担心。该功能本意是与朋友分享密码,让连接WiFi变得更加轻松。这个功能本身没有什么问题,不过你应该知道它的机制。
在Windows 10下登录WiFi网络时,系统会让你选择与Outlook.com、Facebook以及 Skype上的哪些联系人共享登录。如果选择了,WiFi登录密码便会存储到微软的加密服务器中,朋友在需要时便可收到这些密码——他们看不到密码本身的内容,只是能登录WiFi网络。在Windows的WiFi设置中用户可以决定要分享哪些网络。
如果不想有人存储并使用你自己家里网络的密码,登入到朋友的电脑上关闭分享复选框。你也可以在WiFi网络的名称上加入“_optout”的字样,避免使用这项功能。
用户数据需要保护,但不能因噎废食,为了保护所谓的“隐私”而放弃对技术可能性的探索。未来5-10年,依然会是大数据的时代,它会对我们的生活方式带来前所未有的影响,对于用户隐私的讨论也不会停止。但影响最强烈的绝不在技术层面,而是对我们世界观、价值观、人生观的改造,以及对看待事物角度的转变。也许到那时,我们就会意识到“个人隐私”也有暴露在阳光下的必要。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06