
还想在大数据面前隐身?这21个方面你该注意了
你认为大数据对你的了解有多少?答案是相当多。
每次我们用电脑、用手机或是用平板电脑打开一款App时,都会以数字的形式留下浏览的痕迹和路线。绝大多数人都知道,遇到问题就找谷歌,想要与朋友互动就找facebook。但其实我们了解的只是这些网络的基本用途,我们所掌握的也只不过是一个模糊的概念。事实上,互联网所具备的更深层次的内容我 们根本是看不到的。
如今的大数据几乎可以将我们每一个人都看透,我总结了一下,大概表现在21个方面。下面我便开始一一列举:
NO.1 首先,对于你不懂的问题和搜索的内容,Google、Bing和Yahoo!这类搜索引擎肯定是能够给出答案的。其次,对于你浏览过的所有网站,哪怕是所谓的无痕浏览,ISP(Internet Service Provider,即互联网服务提供商)都会详尽地记录下来。
NO.2 Google知道你的年龄和性别,千万别以为你没有主动透露,他们就无从知晓。作为各种广告的发送对象,他们会给你建立一份综合全面的档案,其中包括你的各种兴趣爱好(这方面你是可以自己进行编辑的),他们会据此来给你发送适当类型的广告。
NO.3 Facebook对你的人际关系了如指掌,哪段关系急需挽救它都知道。公司会根据你在Facebook上的各种活动和状态的更新,来预测你的某段朋友关系是否能够维持下去,这种预测的准确性有时简直高得惊人。
NO.4 Google知道你去过的每一个地方。如果你使用的还是Android版的手机,那它的记录就更全了。
NO.5 在英国,你在每一个角落都能够看到闭路电视,所以不管你此时此刻人在哪里,警察都能够查到。他们可以调取全国范围内成千上万个网络摄像头中的数据信息进行定位,这些摄像头可以对车辆的牌照进行扫描,并且拍下每辆车和每位司机的照片。而在美国,情况大致也是一样的。
NO.6 你的手机能够在行进的路途中测量你的速度。(但他们不会将这些信息分享给警察,所以你应该感到庆幸。)
NO.7 你的手机或许还能够根据各种地理或消费信息推断出你家住哪里,公司在哪里。
NO.8 不光是人,就连你的猫在哪里,互联网都一清二楚。通常我们在Instagram或其他社交媒体网络上晒出猫咪照片的同时,会选择分享自己所在的位置。于是它就会利用各种隐形的元数据来获取到准确的地理定位。
NO.9 信用卡公司将你所有的购物清单都记录在案。虽然信用卡公司对客户在何时何地买了何种物品有记录是一件无可厚非的事情,但是有些人可能会担心这些数据影响到自己的信用分数和等级。因为公司会根据你所购买的商品和你所光顾的商店等购物信息来确定你是否存在信用风险。
NO.10 你经常光顾的百货商店会记录下你喜欢的品牌。对于百货商店或药房来说,每完成一笔交易,他们就会收集到大量有关你的购买行为习惯和偏好的数据信息。由于这些商店或药房均是连锁经营,所以当你下次光顾其网站时,他们就可以利用这些数据为你提供个性化的服务,并赠送符合你喜好的优惠券。
NO.11 人力资源总监能够预测到你打算什么时候辞职。现在市场上有一家叫做Workday的人力资源软件公司,它在进行多次的测试之后成功研究出一种算法,能够对文件中的文本进行分析,并根据这些信息进行推测,以掌握员工什么时候有辞职的打算。
NO.12 Target会比你的家人还要更早地知道你怀孕的消息。
NO.13 不管你看什么类型的视频,哪怕只是搜索了一下,并没有点击播放,YouTube都有完整的记录。
NO.14Amazon知道你喜欢的图书类型,Netflix知道你喜欢的视频和影片类型。甚至那些公共图书馆都知道你喜欢光顾的媒体种类。
NO.15 Apple和Google对于你向Siri和Cortana提出的请求也了如指掌。
NO.16 孩子玩的芭比娃娃也会记录下她和孩子们之间的对话,并将这些信息传回Mattel公司。
NO.17 在诸如芝加哥和堪萨斯城这类的大城市中,警察局甚至可以在你实施犯罪之前将你拿下,阻止你的恶行。
NO.18 汽车保险公司可以随时随地地掌握你的行踪,包括行车的位置和时间,以便于在出现违反条例行为的时候对你做出惩罚。哪怕你之前从来没有提起过索赔,它也会照样惩罚你。
NO.19 某些数据经纪人还会帮助不道德的公司对那些弱势消费者进行身份鉴定。举个例子,他们可能会把某个地区内信用紧缩的家庭罗列出来,接着直接上门向其推销一些发薪日贷款。
NO.20 Facebook可以根据你给别人点的赞来判断你的喜好,进行简单的大数据分析,掌握你对生活的满意程度以及你的情绪稳定程度。
NO.21 所有你使用的手机App都会牵涉到你的个人数据信息。比如Angry Birds就需要获取你手机中的联系人信息以及你的地理定位。再比如Bejeweled需要获取你的手机号码。更有甚者,有些App还会在你使用的过程中要求扩音器打开,以获取周围的声音和情况。
以上所列举的21个方面还只是冰山一角。随着我们对大数据的依赖性越来越高,我们也越来越享受大数据给我们带来的便利,所以有的时候被要求获取数据也就不那么反感,甚至会欣然接受。举个例子,iPhone版本的Health App就能够收集很多私人的、健康方面的数据信息,大概是因为涉及到身体健康,大家也都不会抗拒。
但尽管如此,作为消费者,我们还是有主动选择的权利。因此我们在什么时候将自己的信息透露给什么人,都要做到自己心里有数,要自己根据情况来做出选择。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30