
智慧购物、智慧医疗、智慧交通、智慧物联网……来势汹汹的大数据为超过6亿的中国网民描绘了一幅幅美好的生活蓝图。然而,任何技术都是一把双刃剑。在大数据日益商业化的同时,我们也发现,我们在网络上的任何痕迹都无所遁形,各种商业广告“有据而来”,甚至在左右我们的决策。随着大数据技术从行为分析发展到身份认证,在商家看到蕴藏无穷机会的“金矿”同时,我们却发现,在不久的将来,我们将不得不面对一场隐私与安全之战。
数据就是未来的石油、黄金
在不知不觉中,滴滴打车的爽约记录、骗取保费时伪造的个人信息、网店贩卖假货的差评这些往常不被重视的信用信息,将逐渐成为中国民营征信机构开出的个人信用报告中的污点,影响人们的生活。
就在日前,中国人民银行对个人征信业务“开闸”,打破了提供中国个人征信服务被“正规军”垄断的局面,允许八家民营机构开展个人征信业务的准备工作。
从首批机构名单不难看出,监管部门也有意向征信行业注入更多的互联网元素。除了鹏元征信和中诚信征信等公司是从事征信业务多年的老牌机构之外,首批入围名单中,在互联网金融领域风生水起的“三马”——阿里、腾讯、平安均各获一席位。
隶属阿里蚂蚁金服的芝麻信用管理有限公司,借助背后强大的阿里集团的数据支撑,依托阿里云的技术力量,可以对3亿多实名个人、3700多万户中小微企业数据的整合。“芝麻信用日数据处理量在30PB以上,相当于5000个国家图书馆的数据总量。”芝麻信用副总经理邓一鸣告诉记者。
同样是拥有海量数据的腾讯,拥有8亿QQ账户,逾5亿的微信账户,逾3亿的支付用户,所提供的海量数据为旗下腾讯征信带来极大的优势。
这标志着大数据的应用场景再次被大大地丰富。
自2008年起,国内各大中小互联网企业陆续涉足大数据领域,短短6年内,一个个原本遥不可及的构想正逐步成为现实。
通过分析注册资料、消费记录、浏览记录、使用偏好等信息,在用户查地图、找餐馆、看视频、网络购物时,网站和软件仿佛能“洞悉”人们的心思,主动向其提供需要和感兴趣的服务及信息。这背后其实是通过大数据技术,商业广告实现了精准营销,而下一步,随着大数据技术从行为分析发展到身份认证,商业广告还将实现“跨屏营销”。
根据研究机构wikibon的报告,2013年全球大数据市场总体规模为181亿美元,年度增幅达61%,预计到2017年仍将维持30%的年增速。而据预测,中国数据总量2020年将达到8.4ZB(1ZB=1024G的四次方),占全球数据量的24%,届时将成为世界上第一数据大国和“世界数据中心”。
“数据就是未来的石油、黄金。”蚂蚁金服首席信用数据科学家俞吴杰说,“尽管我国征信服务市场起步较晚,但其中蕴藏更多的是机遇,这也是这些民营企业挤破头也要进入征信行业的原因。”
被大数据剥夺的隐私
“它在影响我的决定,我觉得自己正在失去自由。”在青海读研究生的王静告诉记者,“双12”期间在购物网站上“淘货”时,搜索页面下方“你可能需要”一栏中的商品令她陷入抉择:“面对这些商品我确实无力抵抗,但总感觉自己被大数据牵着鼻子走。”
在另一家网站上,王静在搜索栏键入一种商品名称,搜索页面旁随即显示“89%的用户选择购买这款商品”,这同样令她纠结不已:“如果选择其他商品,感觉很不明智。”
国际关系学院文化与传播系教授董璐认为,在从众心理的影响下,消费者会认为多数人的选择是合理的,这很容易左右他们的决策。与传统运营模式相比,网络平台通过大数据计算和分析的结果,大大增强了对用户的控制力。
“有时真不明白这是我自己的选择,还是大数据的选择。”供职于北京一家网络公司的白宇告诉记者,作为朋友们眼中的“应用达人”,在习惯接受各种软件推荐的视频、餐馆和行车路线之余,他也时常感到一丝担忧和恐惧。
“越离不开大数据,就越觉得自己在被大数据控制。”白宇说,现在做吃住行娱的选择时,他和身边的朋友通常是直接采用大数据提供的参考结果。
工业和信息化部电信规划研究院基础网络研究部主任葛振斌说,长久以来,互联网都是为人类提供便利的工具,当网络开始主动“揣摩”人们的心理,一种控制权的“被剥夺感”和对新生事物的恐惧感自然会在一部分网民心中产生。
相对薄弱的防护体系
2013年10月,国内漏洞监测平台“乌云”发布报告称,如家、汉庭等大批酒店的2000万个客户开房记录因存在第三方存储和系统漏洞而被泄露;2014年5月,小米论坛的用户数据库在黑客界传播,给大批“米粉”造成困扰;近日,130万个拟参加硕士研究生考试的考生信息以1.5万元左右的价格被“打包出售”……人们不禁要问,当“大数据时代”来临,用户安全真能得到保障吗?
事实上,随着大数据时代的到来,数据的收集和存储更加方便,但由于缺乏规范,更缺乏监管,主要依靠企业自律,用户无法确定自己隐私信息的用途,而部分企业收集用户数据的使用权限边界界定不清,我国一些网络运营商和企业就将收集而来的数据信息进行大数据分析,分门别类整理后销售给他人,为自己牟取巨大利益,使用户隐私和权益遭受严重侵害。
与此同时,网络化社会无处不在的智能终端、互动频繁的社交网络和超大容量的数字化存储,为获取和存储大数据提供了一个开放、互联的平台。但这一平台的开放性,也使得蕴含海量信息和潜在价值的大数据更容易吸引黑客的攻击。
据上海一家数据中心的工作人员介绍,面对大数据这一朝阳产业,不少网络公司目前都在抢占“高地”,以期能在未来分到一杯羹。然而,许多企业在人才储备、软件开发、运维能力等方面尚存瓶颈,为未来的大数据安全埋下隐患。
“很多中小企业尚未做好准备。他们并没有真正理解什么是大数据,也没有有效管理它们的能力。”这名工作人员说,在缺乏自主核心技术和开发平台的情况下,很容易遭到黑客袭击,无异于“引火烧身”。
更应引起重视的是,目前一些外国企业正在大量收集和分析我国用户的大数据资料。美国微软公司推出智能聊天机器人“小冰”,通过其强大的大数据分析技术能力,收集和分析了中国6亿多网民多年来的聊天记录。目前微软“小冰”已同米聊、易信等多家我国即时通讯工具进行合作开发,通过分析用户聊天内容进行商业开发。
最高人民法院中国应用法学研究所所长孙佑海说,虽然微软公司承诺仅将“小冰”收集的数据传输到云端,并不保存,但实际上无人知晓微软公司是否真的不保存数据,即便不存储数据,美国情报部门仍然可以在通信信道上监听,这将给我国的网络信息安全带来巨大隐患。
隐私与安全之战
一位业内专家曾经这样感慨:于大数据时代而言,这在本质上,就是一场商家与商家之间,用户与商家之间的隐私之战。对于商家来说,谁更靠近用户的隐私,谁就占据了更多的机会;于用户而言,保护隐私,似乎从一开始就是一个伪命题。
工信部电信研究院专家指出,在隐私保护方面,现有的法律体系仍面临两大挑战:一是法律保护的个人隐私主要体现为“个人可识别信息”(简写PII),但随着技术的推进,以往并非PII的数据也可能会成为PII,造成保护范围变得模糊;二是以往建立在“目的明确、事先同意、使用限制”等原则下的个人信息保护制度,在大数据场景下变得越来越难以操作。而我国个人信息保护、数据跨境流动等方面的法律法规,仍需进一步配套健全,这成为制约大数据产业健康发展的重要因素之一。
中国工程院院士邬贺铨说,万物互联时代的设备连接和数据规模都达到了前所未有的程度,不仅手机、电脑、电视机等传统信息化设备将连入网络,家用电器和工厂设备、基础设施等也将逐步成为互联网的端点,远超出传统边界网络安全防御的范围;云计算提高了IT资源使用效率,但其动态虚拟化管理方式、强大的计算与存储能力,也会引发新的安全问题,给安全管理体系带来巨大冲击。
360公司董事长兼CEO周鸿祎指出,移动设备的普及正吸引网络黑暗势力将目标转至移动终端,现有的安全防护手段逐渐失去效力,无法防卫以“数据窃取”和“大数据污染”为目的的恶意威胁,必须以大数据为核心,构建全新的信息安全防护体系。他建议,重塑信息安全要遵循三个基本原则,即以保护用户隐私和数据安全为前提,明确用户对信息数据的所有权,明确企业对信息数据的保障义务,并保障用户在信息交换和使用时的知情权,是万物互联时代保护信息安全的基础。
中国数据中心产业发展联盟秘书长郑宏介绍,未来的大数据关乎用户的人身和财产安全,需出台相关法律明确企业使用用户数据的权限和方式,确立大数据产业的准入标准,建立信息泄露的维权机制,在发展中逐步完善出一套集法律、技术、管理、应用、开发等多个层面为一体的联动数据安全保障体系。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-08-07SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-07大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-07解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-07CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-07通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-07评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-07CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-07反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-07MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-07抖音数据分析师:驱动平台增长的幕后推手 在抖音这个日活用户数以亿计的超级平台上,每一次用户的滑动、点赞、评论,每一条 ...
2025-08-07基于 SPSS 的中介效应分析结果解读:揭示变量间的隐性关联 在社会科学与自然科学研究中,变量之间的关系往往并非简单的直接作用 ...
2025-08-07