京公网安备 11010802034615号
经营许可证编号:京B2-20210330
揭秘贵阳大数据交易所:数据须经“脱敏”保护隐私
4月14日,全国首家大数据交易所在贵阳“开张”。成立当天就做成了一笔大买卖,京东买走了腾讯的“数据产品”。
这间24小时营业的交易所,到底啥模样?看不见摸不着的数据,如何定价进行交易?这些交易,又和普通贵阳市民的生活到底有什么联系?
采访中,工作人员用拟人的口吻,介绍了平台交易的整个过程。
大家好,我是一串数据,出生时被命名“李丽”,记录了贵阳市民李丽在医院妇科就诊的历史信息。
今年4月份,我和兄弟姐妹被卫生部门送进一个大数据交易平台。进入平台之前,卫生部门给我们洗了一次澡。据说,这叫“数据脱敏”。洗完澡,我曾经存储的和李丽相关的私人信息,都不见了。
洗澡经过复杂的“脱敏”程序,我的代号由“李丽”变成“X”,只记录了一位不知名的44岁的贵阳女性的妇科病史。
脱敏成功,我就可以正式进大数据交易所了。进门之前,我猜那里肯定和证券交易所一样,里面有滚动电子显示屏、忙碌的工作人员和热闹的电话铃声。走进去一瞧,才发现,“高大上”的交易所,和淘宝一样,是虚拟的交易平台,平台后方就是一帮戴眼镜的技术人员,在维护这个网站。
淘宝什么都卖,而这个交易所就只买卖数据。刚进门,我听见卫生部门和平台的管理方在商量,谈了我到底值多少钱。等他们定完价,我就被标上价格,进入平台展示窗口,等待买家。
最终,贵阳市一家制药公司看中我,价格也合适,老板把我和数以百万计的兄弟姐妹一起打包买走了。具体交易额是多少,保密;收益由平台和卫生部门四六分成。
到达制药公司,老板将我们塞进数据深度挖掘系统,最终分析出,贵阳市40至50岁的女性,患乳腺增生的几率较高。由此,制药公司有针对性地推出新药。
有一天,我的第一个主人李丽,去医院买了那盒新药。
我很开心,李丽买药及用药反应的记录又生成了全新的数据,下一个数据串X也会随之诞生。更多的数据串,会踏上交易之旅,更多的人会因此受益。
(注:数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。)
数据交易这些事
1.交易数据从哪来的?
交易所提供的只是交易的平台,至于企业与企业之间商业交易的数据,全是卖家通过各种渠道自行搜集、统计、分析之后提供的。
2.任何人都可以买数据?
交易所执行会员制度,不论是卖家还是买家都需要先“入会”才能获得交易资格。入会先提交申请,审核过关的才能进驻交易所。另外,该所尚不接受个人用户参与交易。
3.数据咋定价咋交易?
数据值多少钱,由交易所与数据卖家协商制定。数据内容和交易价格在平台网站上挂出。买家看中了,在平台上拍下就算交易成功。
4.交易数据如何保障普通人的隐私?
进入平台交易前,数据都要经过脱敏,抹去和隐私相关的信息。另外,数据交易的行业公约和大数据立法这两个话题,已经引起各界广泛关注。
5.卖了数据,交易所平台要抽四成收益,企业还愿意来?
卖家当然也可以选择私下交易,但是在交易所这种大平台上交易肯定更省时省力。交易所已纳入百余位交易商会员,其中50家企业来自贵阳本地,另有70多家来自省外。
6.数据卖出去,复制给别人太简单了,那交易所以后不就没钱挣了?
数据买家需遵守交易所制定的保护条例,不得私自转售、泄露“数据产品”,以确保数据不被滥用。
7.说来说去,我们老百姓又挣不了数据交易的钱,那到底和我们有啥子关系?
平台搭建起来后,数据交易更加方便,利用数据掘金的公司也会活跃起来,每个人的生活会因此改变。打个比方,贵阳市民出行的数据经脱敏进入平台,有商家瞅准商机,买了这些数据做出一款APP,每天提前分析出贵阳每个堵点,每个人出行就更方便了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08