京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据开放面对的瓶颈究竟是什么
大数据无影无形却又无所不在,这个听起来冰冷的词汇,如今已经被商机包围。你上网搜索的关键词、你网上购物的记录,你在社交平台分享的消息,你去超市买口香糖的频次,甚至你在八达岭高速上拨出的一个电话,可能都极具“价值”,成为别人洽谈桌上的筹码。
被“窥视”的无奈
对于许多在网上购物的顾客来说,总能在网页上看到与他们浏览记录相似的产品广告, 这似乎让数据变得贴心起来,但大家也逐渐意识到这并不是巧合。网络浏览记录、交易记录、手机通话记录、收发邮件 记录、社交网络记录,你在网络上的每一个“足迹”都会以数据的形式记录并存储下来,它们精准、事无巨细。
不可否认,大数据为监测和预示人们的生活提供了极大的方便,然而个人隐私也随之暴露在无形的“第三只眼”之下。无论是电子商务、搜索引擎还是微博、微信等互联网服务商都对用户行为数据进行挖掘和分析,以获得商业利益,这一过程不可避免地威胁到普通人的隐私。大数据有可能是大机会、大发展、大创新,也可能是大危机、大破坏、大淘汰。
一直以来,大家普遍认为,只要我们在网络中匿名就可以避免个人信息的泄露,但是大数据告诉我们,数据的交叉检验会使得匿名化失效。我们的隐私数据每天被记录,随时有可能被泄露。
“用户在使用微信的时候,免费使用并打开一些关联链接,但是平台拿到了你的信息并窥视了你的隐私,这代表我们享受了这种服务就牺牲了隐私,由于我国法律并没有对数据使用进行相关约束,也没有信用评估的机构进行监管,使得目前很多数据使用还游走在法律的边缘,数据拥有者如何用它、用到什么程度,没有清晰的界定,有触碰隐私的交易也没办法干涉。”中国联通网络技术研究院首席专家唐雄燕告诉记者。
当数据交易还处在不成熟时期时,哪些领域更应该注重数据隐私的保护和规避?大数据产业联盟会长董力明告诉《经济》记者,交易数据获取收益,就有可能涉及个人隐私,比如说在互联网广告领域。“这时就要做数据脱敏以保护隐私,目前在贵州建立的大数据交易所,更多的是和政府相关的数据,这就必然要对数据进行脱敏。”
目前,比较成熟的数据交易方式是通过数据报表交易,报表不涉及隐私,反映的是社会、产业、消费者群体的趋势,隐私数据不能开放不代表不能有数据生态,脱敏后的数据能够流通起来并创造很高的社会效益。
对此,唐雄燕也表示认同,他认为,个人数据最小,但是也最敏感。数据脱敏会把敏感信息进行编码,让这个编码代表唯一的一个人,但又不与他人重复。
追逐利益不能违反规则
作为掌握诸多数据的运营商、企业,如果深入挖掘这些数据,带来的收益非常可观,基于企业、运营商等对数据交易的需求,除去一些非法交易,数据交易今后怎么做?
唐雄燕表示,“由于行业壁垒重、法律不健全以及涉及顾客隐私,现阶段很多的数据还不能轻易进行交易。大家也在探索,作为运营商首先会考虑今后交易一些统计性数据。”
当国内一些大数据领域的互联网公司在数据交易上违反国家的法律和商业道德时,作为数据平台的专业人士,中金标准数据公司总经理郝文嘉认为,要从国家的层面立法打击,毕竟个人的隐私通过互联网被售卖以获取商业利益,这本身就违反了国家《民法》和《经济法》的规定,“国家立法机关要跟上基层进步的步伐”,在全球,隐私交易行为都是不被允许的,这种行为触碰了商业道德底线,想要建立起平等、公平的市场环境就要遵守规则。
可能有一些掌握信息的商业性机构或是管理机构,不注意数据保密,把信息泄露出去,利用信息去追求商业目的,全国政协委员、中华全国律师协会会长于宁向《经济》记者称,虽然国家在隐私保护法律上能找到相关条款,但在大数据领域涉及隐私保护的法律条文还没有跟上。
信息发达和发展带来新变化,这也引起了国家立法机构的重视,《民法》、《刑法》也渐渐地开始体现对隐私的保护,专家学者在反映,法律也在创制、调整,但是具体涉及国家立法的计划,还需要人大常委会的立法机构和法律专业人士进行引领和商讨。
但董力明认为,对某个领域如果监管太多,可能会抑制其活力。
就算利用法律去强制控制,法律和规则有的时候也难以规定得太过具体,所以中间肯定会存在灰色地带,唐雄燕表示,大数据在运营的过程中,“一些问题可能会随着时间逐步显现并规范,大家会形成共识,在一些问题还没显现的时候,不能先出现法律去遏制它的发展。目前的数据交易的平台也在尝试发现问题的过程中,然后去改善。”
别让政策阻碍了数据开放
数据只有连接起来才能创造价值,那么大数据市场真的得到开放了吗?董力明认为,离真正的数据开放还有很远的路要走,“美国和英国数据开放的第一步是跟生物相关的数据,政府希望通过开放这些数据,来增加社会效益,但是在与企业有关的数据上,大多数企业还保持谨慎态度,因为这是数据资产,不可能轻易地开放出来。另外与人相关的数据涉及隐私保护这个敏感地带,所以更是难以得到开放的。”目前社会上开放的,往往是与宏观、经济、政府的一些公共部门,比如说天气、地质相关的数据,这些数据不涉及如军事等相关的敏感信息。
如果技术不是阻碍大数据发展的瓶颈,那还有什么遏制了它的发展?数据开放面对的瓶颈究竟是什么?中国通讯协会常务副理事长兼秘书长张新生说,“是政策上的”,如果不把对各层面利益的分配架构打好,数据开放还是较为漫长的过程,但是也不要把政策看得太重,不盈利也要将大数据做起来。他表示,“别期望政府走在前面,这会遏制创新和产业的快速发展,企业要先动起来,探索的过程永远是未知大于已知。”
那么,数据的把控权利移交政府会否对数据安全有更好的把控?“我觉得政府很难完全控制大数据,只是能够制定一些规则,只有商业机构更清楚地知道数据的价值,政府主要还是保护数据的安全。”唐雄燕说。
大数据并不神秘,但是在国内这种环境下,真正运用大数据的很少,它还面临着认识和能力上的问题。郝文嘉说:“每一种数据都是有缺陷的,因为数据来源于互联网,同时互联网数据的发布也是海量的,这就会存在一些数据发布的参数、量质不符合应用和计算的状况,数据的价值有缺陷就影响发挥,这是任何行业都不可避免的,所以盲目地去相信大数据也不对,正是由于大数据的缺陷性,数据公司就更要努力把缺陷补足。”
目前这个阶段,还处于大数据发展的初级阶段,郝文嘉还认为,经过数据平台对数据的不断补足,对社会数据应用的提高,这个过程中,数据积累到一定程度达到成熟,就会推动整个社会成指数型进步,这也是走向人工智能化的一个基础。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01