京公网安备 11010802034615号
经营许可证编号:京B2-20210330
揭秘贵阳大数据交易所:数据须经“脱敏”保护隐私
4月14日,全国首家大数据交易所在贵阳“开张”。成立当天就做成了一笔大买卖,京东买走了腾讯的“数据产品”。
这间24小时营业的交易所,到底啥模样?看不见摸不着的数据,如何定价进行交易?这些交易,又和普通贵阳市民的生活到底有什么联系?
采访中,工作人员用拟人的口吻,介绍了平台交易的整个过程。
大家好,我是一串数据,出生时被命名“李丽”,记录了贵阳市民李丽在医院妇科就诊的历史信息。
今年4月份,我和兄弟姐妹被卫生部门送进一个大数据交易平台。进入平台之前,卫生部门给我们洗了一次澡。据说,这叫“数据脱敏”。洗完澡,我曾经存储的和李丽相关的私人信息,都不见了。
洗澡经过复杂的“脱敏”程序,我的代号由“李丽”变成“X”,只记录了一位不知名的44岁的贵阳女性的妇科病史。
脱敏成功,我就可以正式进大数据交易所了。进门之前,我猜那里肯定和证券交易所一样,里面有滚动电子显示屏、忙碌的工作人员和热闹的电话铃声。走进去一瞧,才发现,“高大上”的交易所,和淘宝一样,是虚拟的交易平台,平台后方就是一帮戴眼镜的技术人员,在维护这个网站。
淘宝什么都卖,而这个交易所就只买卖数据。刚进门,我听见卫生部门和平台的管理方在商量,谈了我到底值多少钱。等他们定完价,我就被标上价格,进入平台展示窗口,等待买家。
最终,贵阳市一家制药公司看中我,价格也合适,老板把我和数以百万计的兄弟姐妹一起打包买走了。具体交易额是多少,保密;收益由平台和卫生部门四六分成。
到达制药公司,老板将我们塞进数据深度挖掘系统,最终分析出,贵阳市40至50岁的女性,患乳腺增生的几率较高。由此,制药公司有针对性地推出新药。
有一天,我的第一个主人李丽,去医院买了那盒新药。
我很开心,李丽买药及用药反应的记录又生成了全新的数据,下一个数据串X也会随之诞生。更多的数据串,会踏上交易之旅,更多的人会因此受益。
(注:数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。)
数据交易这些事
1.交易数据从哪来的?
交易所提供的只是交易的平台,至于企业与企业之间商业交易的数据,全是卖家通过各种渠道自行搜集、统计、分析之后提供的。
2.任何人都可以买数据?
交易所执行会员制度,不论是卖家还是买家都需要先“入会”才能获得交易资格。入会先提交申请,审核过关的才能进驻交易所。另外,该所尚不接受个人用户参与交易。
3.数据咋定价咋交易?
数据值多少钱,由交易所与数据卖家协商制定。数据内容和交易价格在平台网站上挂出。买家看中了,在平台上拍下就算交易成功。
4.交易数据如何保障普通人的隐私?
进入平台交易前,数据都要经过脱敏,抹去和隐私相关的信息。另外,数据交易的行业公约和大数据立法这两个话题,已经引起各界广泛关注。
5.卖了数据,交易所平台要抽四成收益,企业还愿意来?
卖家当然也可以选择私下交易,但是在交易所这种大平台上交易肯定更省时省力。交易所已纳入百余位交易商会员,其中50家企业来自贵阳本地,另有70多家来自省外。
6.数据卖出去,复制给别人太简单了,那交易所以后不就没钱挣了?
数据买家需遵守交易所制定的保护条例,不得私自转售、泄露“数据产品”,以确保数据不被滥用。
7.说来说去,我们老百姓又挣不了数据交易的钱,那到底和我们有啥子关系?
平台搭建起来后,数据交易更加方便,利用数据掘金的公司也会活跃起来,每个人的生活会因此改变。打个比方,贵阳市民出行的数据经脱敏进入平台,有商家瞅准商机,买了这些数据做出一款APP,每天提前分析出贵阳每个堵点,每个人出行就更方便了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25