京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代还有没有隐私
支付宝年度账单的“捆绑协议”余波未平,擅长“投其所好”的今日头条又陷入“麦克风窃听”丑闻。跟好朋友打电话聊美食,第二天电商平台就在首页推荐各种食材厨具,在社交平台讨论学外语,不久就能接到口语培训机构的推销电话。当“千人千面”的大数据精准营销神通到令人“匪夷所思”,这种始料未及的“心有灵犀”难免令人焦虑:大数据挖掘与个人隐私的边界究竟在哪儿?
精准营销“懂你”心中所想
当你在浏览网页时,屏幕上推送的各种商品广告或许让人生厌。如果这些广告信息正好是你感兴趣的,你还会觉得厌烦吗?
“一直想买一个果汁机,但工作太忙没时间仔细选,最近浏览网页时发现屏幕右侧的广告窗里正好展示的全是各式果汁机,真是我肚子里的蛔虫!点进去发现买家好评不错,功能和价格也合适,就下单了,正好省得再花时间找了。”在外贸公司上班的吴颖对此颇有感触。
在风口转瞬即逝的互联网时代,“快”和“准”早已成为生存的“不二法门”。通过大数据算法勾勒出用户肖像,然后把他们想要的、喜欢的精准送达,进而带动商业价值实现几何数级的增长。亚马逊的个性化推荐助其销售量翻番,而Facebook的精准广告投放更是成功将大把的粉丝和流量变现,这些商业佳话的背后离不开精准营销的“助攻”。
腾讯曾在测试朋友圈广告投放之前发布了一份《朋友圈广告用户研究报告》,数据显示,23.8%的受访用户认为,只要广告和自己有相关性,他们对任何类型的广告都能接受。如果不相关,不管什么样的广告都会成为一种打扰。
然而,当这种“关联”不再只局限于个人此前的关注和消费记录,而是不断向隐私“腹地”蔓延时,不安成为了众多网友的本能反应。
麦克风授权陷“窃听”风波
“我妈给我买了点心,我就看着上面的字念:蔓越莓松饼。手机上从来没有搜过,然后松饼就出现在了我的淘宝首页上,真的把我吓到了!”网友“王辛藏的小口袋”日前发微博如是写道。
不得不提的是,像这样越来越“懂你”的网络体验并非个例。“家属下班进门问做了什么饭,我回答了以后,一翻手机,立马就出现今日头条推荐的做饭信息,想想都恐怖!难道对话被窃听了?”
面对用户的质疑,处于舆论漩涡的今日头条发声回应称,“用户使用今日头条(包括头条旗下产品)进行视频录制时,需用到手机麦克风。除非用户明确点击授权,否则无论哪种手机机型,今日头条都无法获得麦克风权限,无法收到用户任何语音信号。”
同时,今日头条还表示,“从技术角度看,目前声音信息技术的处理,也远达不到通过麦克风获取个人隐私的水平。”
然而,一纸声明显然难以驱散用户心中的疑虑。据腾讯社会研究中心与DCCI互联网数据中心联合发布的《网络隐私安全及网络欺诈行为研究分析报告(2017年一季度)》显示,手机APP越界获取个人信息已成为网络诈骗的主要源头,高达96.6%的安卓应用会获取用户手机隐私权限,而iOS应用的这一数据也高达69.3%。
“目前的语音识别还达不到那么精准的程度,若麦克风可以窃听,对企业来说不仅要承担高风险,也要有大投入,如何从海量语音中识别哪个是用户、哪个是关键词,投入产出并不合算。”一位互联网业内人士坦言。
大数据与个人隐私边界模糊
当你下载安装一款APP的几分钟空档里,几万字的用户协议,隐蔽地在你5.5英寸的手机屏幕上开了个小窗口。你会逐字逐句地细读,还是快速地按下“同意”键?而“不同意”则意味着没有APP会为你提供网络服务。随着各大互联网平台纷纷把大数据算法视为“资产富矿”,大数据与个人隐私的边界也越发模糊。
今年支付宝的年度账单营销,就因为替用户默认勾选“我同意《芝麻服务协议》”而遭到谴责。根据这份协议,用户将允许支付宝收集用户的征信信息,并且允许支付宝将其提供给第三方机构。
“当你完成一次消费支付,你可以把它视为个人隐私,但这同时也是服务商的一次服务过程,是经营记录的一部分。这种情况下,大数据与个人隐私是交叉的。”沪江网法务总监林华告诉记者。但截至目前,大数据挖掘的法律边界并不明确,哪些信息类型可以被互联网平台搜集和提供给第三方,哪些情况下将被视为侵犯用户隐私?立法与执法环节都还未能跟上商业环境的新变化。
业内人士建议,用户要增强隐私保护意识,尽量选择官方正规应用商店下载,安装后要查看应用开放的权限,读取通讯录、短信通话记录、位置信息等敏感权限尽量关闭,在以后提示确实需要相关的隐私权限时再允许APP获取。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05