京公网安备 11010802034615号
经营许可证编号:京B2-20210330
沪大数据产业补上“核心拼图”
上海数据交易中心股东单位签署战略合作协议。东方网4月2日消息:如果说矿产油气等支撑了实体经济与工业文明,股票证券等催生了发达的虚拟经济,那么在大数据时代,看不见摸不着的数据,正逐渐拥有和之前那些或实或虚的资源同样重要的财富地位。要配置资源,就需要交易;借助市场,就会激发出活力。
正加紧为新经济布局的上海,在昨天迎来了大数据产业生态中最核心的一块“拼图”:经历一年多筹备,上海数据交易中心正式挂牌成立。
数据是如何交易的? 比特该遵循什么规则流动? 上海数据交易中心将催生哪些新的机会? 通过对一系列业内人士的采访,记者正逐步接近答案。
交易对象:“数据画像”的关键几笔
“性别”,100元;“年龄”,120元;“汽车车型”,35元……在上海数据交易中心的临时办公地,大屏幕上显示着一些数据的实时价格,最贵的数据每1000条卖135元,最便宜的则是5元。
虽然刚刚挂牌,这家新型平台已经开始试运转,撮合了不少交易,也形成了不少价格。中心首席执行官汤奇峰向记者解释说:“年龄”数据之所以比较贵,是因为这种数据非常稳定,一次购买,几乎终身可用。而那些低价数据,要么使用价值低,要么获取成本低。
只看到价格,或许仍无法理解数据商品为何物。简单地说,在上海数据交易中心交易的数据,就是某一个或者某一类互联网用户的特征和属性。比如,年龄、收入、所在城市、是否看球、关注什么新闻……这些数据组合起来,就为那个网络世界中的“你”完成了一张画像;其中每一项数据,就仿佛是这张画像中的一根线条。
数据的价值,源于不同维度数据的关联和组合。企业要买数据,是因为它所经营的业务需要获得用户的“数据画像”;而它自己无法绘制出那关键的几笔,就只得向他人购买。比如,有公司想推销剃须刀,于是想在成年男性用户的电脑上投放广告。因此,年龄、性别就是该企业感兴趣的数据。
对任何一桩数据交易的参与者而
言,用户隐私都是不可触碰的“红线”。我国法律虽然未对隐私形成完整规范,但姓名、住址、身份证、电话号码等肯定属于不被法律允许交易的数据。为保护用户隐私、同时也是保护买卖双方不踩“地雷”,上海数据交易中心不但严格拒绝任何隐私数据流动,更通过自主开发的“虚拟ID”技术,将用户的网络画像与其真实身份隔离开———换句话说,企业在买到用户特征数据后,无法倒推、对应到具体的人。
产业地位:“数据经济”的生态枢纽
上海数据交易中心已经明确,未来三年,不会向交易双方收取费用。因此,短期内,数据交易无法为上海增加多少税收和就业岗位。然而,这样一家行业公共平台的价值,本来就不该以直接的“GDP思维”来衡量。
一个繁荣的市场,很可能因为资源的集聚而形成产业高地,数据交易也应该不会例外。市经信委副主任邵志清告诉记者,随着大数据时代的到来,围绕数据资源的流动和利用,应该会有助于形成一套新的经济模式,激发新的发展动能。要领“数据经济”的风气之先,推动数据交易中心的运转将是一个重要的机遇。
作为国家经济、金融、航运、贸易中心和科创中心,上海是目前国内数
据生成与应用的领先地区,拥有全球最大的医联数据共享系统、亚洲第二的证券交易额、世界第一的货物和集装箱吞吐量,同时在数据科学研究、关键技术和产品,以及商业应用创新等方面表现活跃,涌现出一批研究机构和企业。
这些“数据经济”参与者构成的产业生态中,交易平台地位特殊。为了促成交易,它的周边不仅可以衍生出诸如数据挖掘、清洗、建模等生机勃勃的第三方服务商,而且一系列亟待填补的法律和制度空白,都有望通过高密度的交易,在实践中探索出解决方案,比如什么是隐私、数据的产权属于网民还是企业、数据增值收益该如何分配等。
正是看到了这些价值,上海才积极支持数据交易中心建立。因事关重大,这样一个总投资仅2亿元的混合所有制企业的组建方案,甚至搬上了市政府常务会议以审议通过。邵志清表示,目前,上海大数据产业的总体布局是“五位一体”的结构,除数据交易中心,其他还包括创新基地、产业基金、产业联盟、研究中心。昨天,首个产业基地和基金与交易中心一起,落户静安的市北高新园区,而设在浦东张江的产业联盟也同时成立。
上海特色:周密筹备,审慎起步
目前,国内包括贵州、江苏、湖北等许多省份已经组建了各自的大数据交易机构。据预测,到今年底,全国类似的交
易平台数量可能达到15到20个。虽然上海大数据交易中心的筹备工作开始得最早,但组建却较晚,原因何在?
不少第三方专家告诉记者,实际上,上海数据交易中心经过了非常审慎、周密的筹备,在交易规则、交易方式、交易对象等问题上深思熟虑。比如,借助长期的技术研发,上海数据交易中心的数据交易,完全是按照在线、实时、连续、自动的方式完成,保证了数据交易的效率,这种模式在其他同类交易机构中还很少见到。此外,上海数据交易中心在隐私保护、政府监管等方面也制定了极具特色的规则,甚至为保证公信力,中心还特意形成了国资控股、管理层持股、各主要数据提供方参股的混合所有制模式。
有业内人士表示,数据交易中心能为买卖双方提供的价值,主要是提供合规性保障、降低交易成本、提高交易效率。从这三方面出发,上海数据交易中心目前的架构,为它赋予了独特的竞争优势。
汤奇峰说,上海数据交易中心的目标,是成为有全球影响力的交易平台。但在起步阶段,他们的步子还会格外慎重。目前,平台只会向会员开放交易,而要成为会员,都必须经过严格审批。
根据规划,年内,上海数据交易中心的会员数量可能会从目前的200多增加到300。而从目前交易中心的大屏幕上记者看到,“性别”等数据的交易量已经超过100万。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16