
大数据开放面对的瓶颈究竟是什么
大数据无影无形却又无所不在,这个听起来冰冷的词汇,如今已经被商机包围。你上网搜索的关键词、你网上购物的记录,你在社交平台分享的消息,你去超市买口香糖的频次,甚至你在八达岭高速上拨出的一个电话,可能都极具“价值”,成为别人洽谈桌上的筹码。
被“窥视”的无奈
对于许多在网上购物的顾客来说,总能在网页上看到与他们浏览记录相似的产品广告, 这似乎让数据变得贴心起来,但大家也逐渐意识到这并不是巧合。网络浏览记录、交易记录、手机通话记录、收发邮件 记录、社交网络记录,你在网络上的每一个“足迹”都会以数据的形式记录并存储下来,它们精准、事无巨细。
不可否认,大数据为监测和预示人们的生活提供了极大的方便,然而个人隐私也随之暴露在无形的“第三只眼”之下。无论是电子商务、搜索引擎还是微博、微信等互联网服务商都对用户行为数据进行挖掘和分析,以获得商业利益,这一过程不可避免地威胁到普通人的隐私。大数据有可能是大机会、大发展、大创新,也可能是大危机、大破坏、大淘汰。
一直以来,大家普遍认为,只要我们在网络中匿名就可以避免个人信息的泄露,但是大数据告诉我们,数据的交叉检验会使得匿名化失效。我们的隐私数据每天被记录,随时有可能被泄露。
“用户在使用微信的时候,免费使用并打开一些关联链接,但是平台拿到了你的信息并窥视了你的隐私,这代表我们享受了这种服务就牺牲了隐私,由于我国法律并没有对数据使用进行相关约束,也没有信用评估的机构进行监管,使得目前很多数据使用还游走在法律的边缘,数据拥有者如何用它、用到什么程度,没有清晰的界定,有触碰隐私的交易也没办法干涉。”中国联通网络技术研究院首席专家唐雄燕告诉记者。
当数据交易还处在不成熟时期时,哪些领域更应该注重数据隐私的保护和规避?大数据产业联盟会长董力明告诉《经济》记者,交易数据获取收益,就有可能涉及个人隐私,比如说在互联网广告领域。“这时就要做数据脱敏以保护隐私,目前在贵州建立的大数据交易所,更多的是和政府相关的数据,这就必然要对数据进行脱敏。”
目前,比较成熟的数据交易方式是通过数据报表交易,报表不涉及隐私,反映的是社会、产业、消费者群体的趋势,隐私数据不能开放不代表不能有数据生态,脱敏后的数据能够流通起来并创造很高的社会效益。
对此,唐雄燕也表示认同,他认为,个人数据最小,但是也最敏感。数据脱敏会把敏感信息进行编码,让这个编码代表唯一的一个人,但又不与他人重复。
追逐利益不能违反规则
作为掌握诸多数据的运营商、企业,如果深入挖掘这些数据,带来的收益非常可观,基于企业、运营商等对数据交易的需求,除去一些非法交易,数据交易今后怎么做?
唐雄燕表示,“由于行业壁垒重、法律不健全以及涉及顾客隐私,现阶段很多的数据还不能轻易进行交易。大家也在探索,作为运营商首先会考虑今后交易一些统计性数据。”
当国内一些大数据领域的互联网公司在数据交易上违反国家的法律和商业道德时,作为数据平台的专业人士,中金标准数据公司总经理郝文嘉认为,要从国家的层面立法打击,毕竟个人的隐私通过互联网被售卖以获取商业利益,这本身就违反了国家《民法》和《经济法》的规定,“国家立法机关要跟上基层进步的步伐”,在全球,隐私交易行为都是不被允许的,这种行为触碰了商业道德底线,想要建立起平等、公平的市场环境就要遵守规则。
可能有一些掌握信息的商业性机构或是管理机构,不注意数据保密,把信息泄露出去,利用信息去追求商业目的,全国政协委员、中华全国律师协会会长于宁向《经济》记者称,虽然国家在隐私保护法律上能找到相关条款,但在大数据领域涉及隐私保护的法律条文还没有跟上。
信息发达和发展带来新变化,这也引起了国家立法机构的重视,《民法》、《刑法》也渐渐地开始体现对隐私的保护,专家学者在反映,法律也在创制、调整,但是具体涉及国家立法的计划,还需要人大常委会的立法机构和法律专业人士进行引领和商讨。
但董力明认为,对某个领域如果监管太多,可能会抑制其活力。
就算利用法律去强制控制,法律和规则有的时候也难以规定得太过具体,所以中间肯定会存在灰色地带,唐雄燕表示,大数据在运营的过程中,“一些问题可能会随着时间逐步显现并规范,大家会形成共识,在一些问题还没显现的时候,不能先出现法律去遏制它的发展。目前的数据交易的平台也在尝试发现问题的过程中,然后去改善。”
别让政策阻碍了数据开放
数据只有连接起来才能创造价值,那么大数据市场真的得到开放了吗?董力明认为,离真正的数据开放还有很远的路要走,“美国和英国数据开放的第一步是跟生物相关的数据,政府希望通过开放这些数据,来增加社会效益,但是在与企业有关的数据上,大多数企业还保持谨慎态度,因为这是数据资产,不可能轻易地开放出来。另外与人相关的数据涉及隐私保护这个敏感地带,所以更是难以得到开放的。”目前社会上开放的,往往是与宏观、经济、政府的一些公共部门,比如说天气、地质相关的数据,这些数据不涉及如军事等相关的敏感信息。
如果技术不是阻碍大数据发展的瓶颈,那还有什么遏制了它的发展?数据开放面对的瓶颈究竟是什么?中国通讯协会常务副理事长兼秘书长张新生说,“是政策上的”,如果不把对各层面利益的分配架构打好,数据开放还是较为漫长的过程,但是也不要把政策看得太重,不盈利也要将大数据做起来。他表示,“别期望政府走在前面,这会遏制创新和产业的快速发展,企业要先动起来,探索的过程永远是未知大于已知。”
那么,数据的把控权利移交政府会否对数据安全有更好的把控?“我觉得政府很难完全控制大数据,只是能够制定一些规则,只有商业机构更清楚地知道数据的价值,政府主要还是保护数据的安全。”唐雄燕说。
大数据并不神秘,但是在国内这种环境下,真正运用大数据的很少,它还面临着认识和能力上的问题。郝文嘉说:“每一种数据都是有缺陷的,因为数据来源于互联网,同时互联网数据的发布也是海量的,这就会存在一些数据发布的参数、量质不符合应用和计算的状况,数据的价值有缺陷就影响发挥,这是任何行业都不可避免的,所以盲目地去相信大数据也不对,正是由于大数据的缺陷性,数据公司就更要努力把缺陷补足。”
目前这个阶段,还处于大数据发展的初级阶段,郝文嘉还认为,经过数据平台对数据的不断补足,对社会数据应用的提高,这个过程中,数据积累到一定程度达到成熟,就会推动整个社会成指数型进步,这也是走向人工智能化的一个基础。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-29左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-29CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-29CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-29解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-29解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-29鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-29用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-29从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-29CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-29解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-29用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-29从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-292025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-29PyTorch 核心机制:损失函数与反向传播如何驱动模型进化 在深度学习的世界里,模型从 “一无所知” 到 “精准预测” 的蜕变,离 ...
2025-07-29t 检验与 Wilcoxon 检验:数据差异分析的两大核心方法 在数据分析的广阔领域中,判断两组或多组数据之间是否存在显著差异是一项 ...
2025-07-29PowerBI 添加索引列全攻略 在使用 PowerBI 进行数据处理与分析时,添加索引列是一项极为实用的操作技巧。索引列能为数据表中的每 ...
2025-07-29CDA 数据分析师必备技能全解析 在数据驱动决策的时代,CDA 数据分析师作为连接数据与业务价值的桥梁,需要具备多元化的技能体系 ...
2025-07-29解析 LSTM 训练后输出不确定:成因与破解之道 在深度学习处理序列数据的领域,长短期记忆网络(LSTM)凭借其捕捉长距离依赖关系 ...
2025-07-29χ² 检验与 t 检验:数据差异分析的两大核心工具 在统计学的方法论体系中,假设检验是验证数据规律、判断差异显著性的核心手段 ...
2025-07-29