京公网安备 11010802034615号
经营许可证编号:京B2-20210330
“这家工资还没有现在公司给的高呢!”董锋把公司的名称输入“曝工资”软件中,该公司各个职位的工资便马上显示出来。连面试都没有进行,准备跳槽的董锋就靠手机上的一款APP知道了备选几家公司每月的工资额度。
不仅仅是查工资,日积月累而生成的大数据其实离老百姓并不远。昨天,服务于数据拥有者与应用者的北京大数据交易服务平台上线,这个把“大数据”当成“淘宝”来打造的平台,能帮助开发者研发软件,甚至引导新产品设计,最终惠及普通市民。
能干啥用?
查工资找饭店都能办
“曝工资”擅长帮求职者“打听”别人每月挣多少钱。董锋的这一次简单的查询背后,却是数以万条的信息在运动。其实,秘密很简单,一方面替人打听,另一方面也欢迎别人曝光,这一来一往,信息就像一颗越滚越大的雪球,最终靠着“大数据”帮不少人解决了难题。
罗马城不是一天建成,大数据也靠慢慢积累。在一开始无人曝光的情况下,“曝工资”的开发者欧啟生四处联系各家招聘公司、中介搜集不同职位的数据。等量够了,最终才上线运行,“从各方搜集数据是很关键的环节,要不也不可能吸引用户。”
一边为寻找数据而苦恼,而另一边却是眼看着数据堆成了山。以董锋寻找到的招聘公司为例,对于每月工资这些数据,一些公司基本无人过问,更别说整理,另一些公司虽然有过总结分析,除了自家使用外,也很难发挥更大的作用。
躺在各家的数据其实对老百姓非常有用。
“开发者看到机构发布的路况数据、道路积水数据,用到软件中,最终就变成了上下班高峰期哪些地方最容易堵车、下暴雨哪些路段积水最严重,大数据也都能瞅见这些小处。”北京大数据交易服务平台的发布者北京软件和信息服务交易所总裁胡才勇告诉记者,随着一些机构、特别是政府机关看到了数据的重要性,把数据公开,被开发者应用到各自的生活服务软件中,或者为最新产品的设计提供支持,也能更方便老百姓的生活。
怎么用?
数据当“淘宝宝贝”卖
就像“双十一”疯狂的淘宝一样,在北京大数据交易服务平台上,买卖交易的“宝贝”就是摸不着看不见的数据。
在这一平台上,一些重要的公益性数据将免费开放使用,这些数据来自本市多个政府机关。从2012年10月开始,“北京市政务数据资源网”测试运行。在这个网站上,汇集了本市各政府部门可开放的、有经济和社会利用价值的数据资源,为社会公众、特别是广大中小企业及个体创业者提供各类实时与非实时数据的下载与服务,从而促进中小企业和个体创业者基于政府数据开发形成信息服务产品。市信息资源管理中心总工程师穆勇介绍,截至今年8月30日,网站注册用户1600多个,数据资源累计下载量17350次。
而这些数据也将会导入北京大数据交易服务平台,有需要的企业可以进行下载。不仅如此,大批的商业数据也将进入平台,政府、机构、企业、用户都可以在平台上提供数据,盘活数据资产。
相比之前成立的中关村数海大数据交易平台,北京大数据交易服务平台则更多提供第三方服务。“就像淘宝一样,有人在上面发布内容,有人在上面购买,我们在中间提供服务。”胡才勇说,北京大数据交易服务平台并不做数据的整理工作,而是制定标准,向交易双方提供确权(确认所有权、使用权的隶属关系)、资金保护等服务。
新闻延伸
大数据标准正在制定
今年9月,经全国信标委2014年第二次主任委员办公会审议,全国信息技术标准化技术委员会大数据标准工作组成立,负责制定和完善我国大数据领域标准体系。
根据目前发布的体系框架来看,大数据标准将主要分为基础标准、数据处理、数据安全、数据质量、产品和平台、应用和服务6大领域,每一个领域又都被分出多个小项目。
工业和信息化部电子工业标准化研究院副院长高林告诉记者,发布的一些数据中是否会涉及到人的隐私、用户应该通过何种渠道获取、是否该进行“脱敏”处理,这些数据的安全问题是最基本的问题之一。一系列标准的制定也是为了更好的规范大数据的使用。
“目前已经进入标准草案的制定阶段,根据预期,大约在2016年陆续发布。”高林说。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31