京公网安备 11010802034615号
经营许可证编号:京B2-20210330
做大数据真的能赚钱吗
于IT业内,大数据之火热程度,似乎无出其右者。当然,在其真正爆发前夜,也应该适时泼盆冷水。
谁能接触到数据
以我来形容中国大数据产业,可称“蒙面狂奔”四字。在没有思考清晰盈利模式之时,已蒙面狂奔,绝尘而去。
国内冠以大数据之名的企业数以千计,但细分其专注领域,大致可归属三类:其一,平台型企业,例如华为、星环科技、浪潮、新华三等;其二,工具型企业,例如在数据采集、数据分析、数据清洗、数据可视化等领域中的海量数据、帆软软件、明略数据等;其三,应用型企业,例如百分点,以及国内诸多行业方案商多属于此类型。
不需否认,大数据已在国内诸多行业领域展现出其价值,但深究典型案例,应远未如媒体宣传中显著。为何?有资格被称为大数据企业,取决于两个先要条件:其一,掌握或接触到用户数据;其二,有能力为用户提供数据服务。
先观察首要条件,大数据企业能否掌握,或接触到用户数据。答案:很难。除互联网公开数据之外,第三方能接触到的数据资源着实有限。以IT方案商为例,此前其以为用户设计、实施行业应用软件为主营业务,理论上距离数据最近,但就如建筑商,建设了广厦千万间,建设了条条大路通罗马,也不能掌握居民和车辆信息一样。方案商实施了行业应用软件,其中也承载了海量价值数据,但这并不等同于能接触到数据。
退一步说,在企业意识到数据也是资产,数据也能创造价值后,其正急需寻找数据服务商,或数据运营商。而能够承担此角色者,IT方案商应为首选。原因?方案商为企业用户提供了十余年IT服务,多少会产生些信任度,从IT服务,延伸到数据服务,应为顺其自然。
而问题又由此而来,大数据真的有用吗?实施了铁路车辆检修大数据系统,工人手中使用了几十年敲敲打打的“小铁锤”就能退休?实施了金融风险管控大数据系统,其结论是否能直接自动导入金融机构业务流程,而无需人工干预?答案基本否定。
原因在于,大数据应用服务商即使能获得用户数据,也极其有限、极其不全面。以城市交通信息为例,此类通常掌握在20余部门手中,方案商几乎不可能全面融合此类数据。而基于不全面的、错误的数据源,也就不可能推导出正确,有决策价值的结论。
做大数据真的能赚钱吗?
当然,基于局部数据,也仍有可能建设出经典的大数据案例。但大数据项目真的赚钱吗?未必。在诸多大数据企业中,融资进度大多在B轮和C轮之间,尚没有一家企业完成D轮融资。也就是说,距离赚钱尚早。
而细分技术领域,首先,大数据工具类企业业务模式相对简单,其只是产业链中的一环,实现盈利相对容易。其次,大数据平台型企业,其盈利模式比较复杂。单纯依靠销售大数据平台几乎不可能产生经济效益,而基于不同的业务出身,其业务模式又可分化为三个流派,一类企业希望以大数据平台带动底层硬件产品销售;而另一类企业,通过提供支持标准的SQL接口,依靠提供数据服务实现盈利。当然,第三类企业比较“野蛮”,希望通过数据,或基于用户数据的服务直接变现。
而除此之外,业务模式更为“枯燥”的是大数据应用类企业。通常行业方案商的大数据业务范畴包括:数据获取、整合、治理、应用和展现等,其中尤以数据治理最苦最累,在大数据项目中50%~60%的工作量也集中于此,不要忽悠什么人工智能、深度学习能解决此类问题,基本还属于纸上谈兵的阶段。
问题由此而来,脏活累活总还是要有人干。配备10名数据科学家不能算多吧!月薪1万元要也不算苛刻吧!如此算下来,稍有实力的方案商大数据部门,年均人力成本就应在250万元以上。250万元?要做多少大数据项目,而且前提是要保证每个项目间要有很好地时间衔接,还要保证每个项目的能力需求都要与数据科学家的专长技能相匹配。
同时,与云计算不同,云计算考验方案商纯IT方面能力,而大数据项目则需要方案商数据科学家与行业团队,以及用户业务专家紧密结合,合作建立基于应用场景的数据分析模型。由此,每个项目的成功均需具备“天时、地利、人和”。也就是说,单个大数据项目的定制化程度相对较高,达到50%~40%,项目间很难具有可复制性,方案商也因此较难建立成熟的大数据项目盈利模型。
但最后还需说一句,形容中国大数据产业为“蒙面狂奔”,也许言过其实,但诸多桎梏确实摆在眼前。不管是依靠数据服务,还是行业应用定制,中国大数据产业仍需极大的人力消耗,成熟的盈利模型尚未建立。“蒙面”是现状,也是必然阶段,但衷心希望中国大数据企业再“狂奔”一两年之后,面纱终能被一缕清风揭去。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01