在大数据的年代,避免被惦记
前段时间,我们花了个周末出去短途旅行。在车上,LD跟我说:哎呀,忘记通知送鲜奶的,明天我们不在家,不用送奶了。你说现在大数据这么厉害,为什么不能做到智能点呢?比如手机定位发现家里人都出去了,或者用水用电监控发现家里没有人,就自动通知送牛奶的、送纯净水的,这段时间不要送了?
我答:这想法倒是好,但是万一数据被滥用呢?你不在家的消息,送牛奶的知道了是不会来,但是小偷知道了,可能正要上门呢。
她接着问:这倒是个问题。但是,技术那么厉害,你们难道不能限制信息只让送牛奶、送水的人知道,不发给别人吗?
我想了想:这个,好像真做不到。数据本身是中性的,一般没办法限定那么细的用途。而且即便只发给送牛奶、送水的人,也没法保证他们不会对外传播呀……
这答案让她无奈了:如果“知道我不在家”的人让我信不过,信息又会四散传播,看来还是不要大数据的好。
这段对话让我印象深刻,是因为它代表了当今很多普通人对“大数据”的认识。普通人一般认为,大数据很神奇,很强大,很有用,可以给我们提供很多便利。没错,通过收集、存储、分析、挖掘大量数据,我们的确享受到很多便利。
但是出于职业习惯,我会想的更多。很多时候我们只看到,“方便”是目的,运用大数据手段收集、存储、分析、挖掘数据,则是达到目的的手段。然而一旦数据被拿走,就不知道会存在什么地方,能被谁看到,继而怎么分析,是否仅仅用于当初那个“方便”的目的。
前些年流行过一阵“车载智能”设备,装在你的汽车的OBD(车载诊断)接口上,然后就可以看到自己车的详细数据,比如节气门开度、喷油量等等,进而可以晒数据,也可以准确知道自己的驾驶习惯是否优秀。看起来很神奇对不对?科技含量确实足够高。
但是你或许不知道,详细收集这些数据的目的并不只是简单改进你的驾驶习惯,还有更深层次的目的。记录了你的驾驶习惯,以及你经常走的路线,就可以判断你出事故的几率。知道了出事故的几率,就能为你“量身定制”保险的保费。车主把数据交托出去,可能就是简单直接地想到“看到我的车的运转细节”,绝不会想到“我的保费因此上涨”吧。
不要以为这种情况只针对“有车一族”,同样的逻辑早已深入生活,不少“健康体检”也是这样的玩法。通过体检了解不同人的身体情况,保险公司拿到这些数据之后,评估出每个人买保险的风险高低,作出不同决策。你以为参加免费或者低价的体检,是自己占了便宜,其实真正占便宜的没准是保险公司。
中国有句老话:不怕贼偷,就怕贼惦记。我觉得,它也挺适合描述大数据时代的处境。“贼偷”,代表的是传统生活里和贼的一次相遇,尽管损失可能会惨重,但无非是一锤子买卖,损失有限。“贼惦记”,代表的是大数据时代下,基于个人的行为数据持续对个人反复分析,且美其名曰“挖掘潜在价值”。
“挖掘潜在价值”,这个说法听起来很美妙,其实掩盖了不少东西。
重要的问题是,价值是谁的,谁能享受到这种价值?窥见你的兴趣,推一些商品让你买,你最终买了,大概是给双方创造了价值。但是,如果你本来只是打个顺丰车,却让车主给你标上“肤白貌美”、“娇美柔弱”、“非此女不娶”的标签,当然还是在挖掘你的价值,但受益的到底是谁,恐怕就不是个简单问题了。
身为技术人员,我很清楚地知道,目前我们对“大数据”的收集能力,要远远大于对其应用正当性的管理能力。比如,如今许多“大数据公司”已经可以用非常低的成本拿到普通用户的大量数据,姓名、年龄、籍贯、户口所在地、收入情况、消费习惯、信贷状况……许多时候,数据收集方甚至没有明确这些数据有什么用,但是仍然抱着“数据不怕多,收集了再说”的念头下手。
然而,有这么多数据在手,如何保管、使用,却一直没有明确、合理的规范。如果某项数据被滥用了,要追查“滥用”的来龙去脉往往异常复杂,甚至证实“滥用”本身也很难。
当然,大多数情况下,数据在收集之前都会和用户签一份协议,尽管绝大多数用户根本懒得看也看不懂(或许根本就没想让你看懂)这份云山雾罩的协议到底说了什么。在绝大多数人的潜意识里,“我授权你用我的数据”并不等于你“我授权你在当前场景下、为我们约定的明确目的,利用我的数据”,他们并不知道,数据一旦被收集,就难以避免被非法复制,难以避免被用于其它目的。
这不是危言耸听。我们身边有许多人喜欢拍胸脯说“这就是我的隐私,拿去吧,我无所谓”。其实据我观察,他们并不是真的无所谓,而是根本没有认识到,隐私被拿去可以用来干什么。一旦告诉他们,“隐私”甚至包括他们每个月收入多少钱、花多少钱、去什么地方、钱是怎么花的、和谁一起消费……
如果你仍然觉得无所谓,那么玩法可以继续升级,拿到这些私密信息就可以冒充你的密友,去获取其他人信任、展开诈骗…… 按照我的经验,绝大多数一开始“无所谓”的人,其实都是不懂,一旦讲明白这些道理,都感到心惊肉跳。相反,越是懂技术的人,越不会对此无所谓。
那么,有什么好办法约束这种情况,避免“被(恶意)惦记”吗?至少在我看来答案很悲观:没有。这些数据往往都是现成躺在公司的数据仓库里,等待着业务从各种角度的反复爬梳、挖掘。目前这类问题大多处在法律模糊地带,唯一有可能约束它们的,暂时只有公司的价值观和职业道德。
不过,价值观、职业道德这玩意儿多少钱一斤?我真不知道。你大概记得,好几次出现类似的事故,BAT中某家的员工都是同一套说辞:别跟我们谈道德,我们只是家公司,赚取利润才是公司的首要目的,懂吗?
在这种嘴脸面前,你还能指望自己的数据因为有“职业道德”约束而不被滥用?反正我是不敢。我们唯一能做的,只有“不跟你打不必要的交道,也不给你不必要的数据”。
这也是我想说的,大数据的时代已经来临,大数据时代对隐私的侵犯和滥用又没有很好的解决方案,身为普通人,我们能做的就是避免被大数据惦记,不泄露那么多数据,不让泄露的数据被串联起来,精确定位到我们——总之,避免被大数据惦记。
怎么做才能避免被大数据惦记呢?
我觉得,最重要的是“不要单纯图省事,单纯怕麻烦”。无数“居心叵测”的数据收集,都是打着“为你方便”的幌子进行的。天知道挂着“方便”牌匾的门下面暗藏着几条地道,通向什么地方。你在这里方便了,在其它地方会不会方便,会不会有风险?这些问题既然未知,就别一心想图方便。
如果认可“不要单纯图省事,单纯怕麻烦”,下面有些具体的指引,大概能给你点帮助。
1.申请专门的手机号,用于银行等要害信息。如今手机号已经越来越重要了,方便了认证,也方便其他人知道了我们的联络信息,就能顺藤摸瓜找到网银账号等等。所以,申请一个专门的手机号,专门用于银行等要害信息很有必要。如今各大运营商都推了不少含有副卡的套餐,直接申请个副卡很方便。重要的是,这个手机号尽量避免暴露,避免被其他人知道。
2. 对这个专门的手机号,配备专门的手机,使用“有良心”的系统,比如iOS或者干净的Android。现在许多Android手机都提供了“智能短信”的服务,能把收到的银行短信做好格式化,换一种更美观的表现方式。这样做,用户体验当然是更好了,用户隐私也没了。黑产之所以知道许多人的私密信息,读到“您尾号xxxx的银行卡刚刚入账工资xxxx元”是个特别好的途径。
3.为不同账号设置不同的密码。在大数据的年代,要串联多个场合定位同一个人,难度其实并不大。考虑到许多时候我们的用户名都是手机号或者邮箱,而手机号和邮箱又不可能经常变化,“知道你在甲网站账号就可以破解你在乙网站账号”的难度就低了很多。比较好的办法是,为不同的账号提供不同的密码。当然,你不必死记硬背,有个窍门是按自定规矩来生成密码。密码有一部分是固定的,还有一部分是变量,变量可以根据网站来生成。比如京东的域名是JD,看看电话的拨号键盘,J和D对应的按键分别是5和3,所以你的密码中的变量就是5和3。其它网站的密码都可以照此类推。
4.善用浏览器的隐身模式。如今许多浏览器都提供了隐身模式,其实也就是“不带任何历史信息干净模式”,这样就避免了被定位,出现“你刚在甲网站搜了某商品,乙网站马上就给你推对应购物信息”的情况。我的习惯是,每天早上新开一个隐身窗口,当天大部分浏览都在这个窗口里进行,晚上关掉。这样真正做到了“tomorrow is another day”。
5. 如果你习惯没事玩手机,不妨安排点不一样的玩法,详细检查手机里每个应用申请的权限。许多应用默认会申请完全没有必要的权限——比如地图申请通讯录和发短信的权限。但是关掉这些权限,它也可以运行。所以没事玩手机时查查权限列表,确保关掉了不必要的权限,这是个好习惯。
6. 在遇到各种App或者活动申请权限的时候,停下来换个角度想一想。不要单纯从“为了达到眼前的目的,我需要提供哪些数据”的角度来看,还要想想“一旦我提供了这些数据,你还可以用作其它什么目的”。这种思维习惯建立了,许多不怀好意的运营伎俩就会看得非常清楚。
7. 把行为拆散到不同的App和不同的生态,打散成碎片。虽然互联网公司的大数据很厉害,但不同互联网公司之间的大数据通常不是互通的,我们很难想象,微信和支付宝之间互通数据。所以如果你习惯手机支付,不妨有意识地混用微信和支付宝,不要单纯依赖一家,有些时候,用用现金也是非常好的习惯。如果你喜欢看书,没事逛逛书店买几本书,既支持了实体书店,也避免了暴露自己全部的购书记录。
8.注意保护其他人尤其是未成年人的隐私。我经常看到很多人在朋友圈晒娃,不但有小朋友的面部照片,还有生日、得奖、体检等等详细信息。这样做或许提供了一时的欢乐,但是换位思考,大概没有人愿意长大之后,被长辈甚至不认识的朋友拿出照片来,细细历数自己小时候的成长细节。再进一步说,如果“别有用心”的人或系统平时把这些信息收集起来,可以做什么更是未知数。所以,即便要在朋友圈晒娃,也一定要注意适度。
我衷心祝愿大家在大数据时代能生活得安全、开心,不要被目的不明的大数据惦记着。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-25在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-24以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《刘静:10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda ...
2025-04-23大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03