
大数据时代,保护用户数据不能因噎废食
进入“大数据时代”之后,用户数据愈发暴露在“阳光下”,我们可以清楚地看到用户在互联网上的一些行为几乎都会被服务提供方知晓。就像淘宝、亚马逊监视着我们的购物习惯、Google监视着我们浏览网页的习惯,微博了解我们的信中所好,滴滴打车知道我们每天出行的时间的地点,微信似乎什么都知道,包括我们的社交关系和消费能力。而多维度数据结合起来,几乎可以构建出关于一个互联网原住民的一切信息。
但我们是否就要据此放弃给生活带来无限便捷的互联网产品?答案显然是否定的。保护个人隐私不能因噎废食。大数据的年代,个人隐私问题肯定会更集中,但不能因为有风险就拒绝大数据,就像不能因为菜刀可以砍人,就不允许用了是一个道理。
对互联网企业来讲,从用户那里收集到的信息主要包括消费习惯、行为特征、个人数据等,企业可以通过收集这些信息去开展大数据分析,进一步挖掘用户的潜在消费能力,更多元化的价值,从而为用户提供更有针对性的服务。在这个前提下,消费者或用户也许可以让渡一定的个人隐私。
同时,风口浪尖上的Windows 10发言人也表述,任何与微软分享的数据,都将有消费者自己决定。换言之,微软不会在任何未经许可的情况下收集用户数据。
用户能做些什么
虽然微软称是否与微软分享数据由用户自身决定,但Windows 10很多数据收集机制都是默认开启的。因此我们要明确在什么地方可以关闭,并且是否会影响系统功能?
最活跃的数据收集应用是虚拟助理Cortana。她可以跟踪记录你的网页搜索记录,查看邮件知道你的偏好与日程安排。大部分这类信息都存储在一个可编辑的“记事本”中,这个选项在打开Cortana后便可发现。微软的必应搜索引擎也会存储信息,用户可以点击“设置”——“Manage what Cortana knows about me in the cloud”进行清除,或者直接前往bing.com/account/personalization调整。
微软表示,公司会用“多种安全技术与流程”保护Cortana收集到的数据。这些数据在传输到微软时是加密的。但执法机构和政府部门也可能会强制微软交出部分数据。
如果不想微软涉入个人生活,你可以选择不要把Windows 10与微软帐号连接起来(在安装过程中,当被要求用微软帐号登陆时,选择“创建新账户”以及“不用微软帐号登录”)这种情况下,Windows 10的搜索框仍然有效,但Cortana在没有微软帐号的情况下无法使用。内置的反病毒软件仍然可用。
即便不用微软帐号登录,Windows 10也可能会以其他很多方式收集数据。尤其是Edge浏览器将必应作为默认搜索引擎,这可以跟踪一些活动(如果不登录就是匿名的),并会让用户看到有针对性的广告。进入choice.microsoft.com调整,用户可以选择停用广告追踪。Edge还会预判你要看的网页,从而提前加载你可能点击的网页。可以在Edge的设置中关掉这一功能。
在Windows的设置菜单中,还有很多其他关于隐私的开关。这其中包括微软接受并分享有关用户电脑UID、地理位置、麦克风、摄像头的种种信息,甚至还包括输入习惯。如果使用Windows 10的快速安装,那么所有这些设置都是默认开启的。在“设置”菜单中,用户也可以限定具体应用对这些功能的使用。
关于WiFi密码分享工具
Windows 10中一个名叫“WiFi Sense”的功能也有些令人担心。该功能本意是与朋友分享密码,让连接WiFi变得更加轻松。这个功能本身没有什么问题,不过你应该知道它的机制。
在Windows 10下登录WiFi网络时,系统会让你选择与Outlook.com、Facebook以及 Skype上的哪些联系人共享登录。如果选择了,WiFi登录密码便会存储到微软的加密服务器中,朋友在需要时便可收到这些密码——他们看不到密码本身的内容,只是能登录WiFi网络。在Windows的WiFi设置中用户可以决定要分享哪些网络。
如果不想有人存储并使用你自己家里网络的密码,登入到朋友的电脑上关闭分享复选框。你也可以在WiFi网络的名称上加入“_optout”的字样,避免使用这项功能。
用户数据需要保护,但不能因噎废食,为了保护所谓的“隐私”而放弃对技术可能性的探索。未来5-10年,依然会是大数据的时代,它会对我们的生活方式带来前所未有的影响,对于用户隐私的讨论也不会停止。但影响最强烈的绝不在技术层面,而是对我们世界观、价值观、人生观的改造,以及对看待事物角度的转变。也许到那时,我们就会意识到“个人隐私”也有暴露在阳光下的必要。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23