京公网安备 11010802034615号
经营许可证编号:京B2-20210330
警醒 大数据是如何赚钱和亏钱的_数据分析师考试
大数据无疑是时下炙手可热的流行词汇,然而,我们鲜少看到具体大数据如何带来收益,和具体如何实现的例子,这是怎么回事呢?
多年来,在经历了几个通信和投行的大数据相关早期实施项目后,我认为这个新兴技术的收益主要在于:实现对复杂系统更为精准的剖析,例如股票市场或供应链。(投行成为最早一批应用大数据分析的行业之一,可谓毫不意外。对利用技术提升效率,创造效益更为敏锐的商业模式,往往也是更赚钱的。)
在投行的日常工作中,为了精准地选择投资机会、选购股票,有大量对文档处理的需求,例如新闻简报,财务报表。如果人工进行,工作量过于庞大。因此助理分析师们往往简化他们的预测分析过程,并使用电子表格来完成绝大部分工作。通过大数据技术,投行可以整合各种信息,减少可能的(简化分析带来的)风险,从整体上带来更优越的分析和预测能力。
公司如何通过大数据赚钱
通过大数据平台,股票经纪和投资经理们可以聚合各种来源的非格式化数据,辅助判断哪些公司值得投资。所谓‘非格式化数据’包括如公司新闻,产品评论,供应商数据,价格变化,将这些信息以所谓“大数据”形式整合,通过建模,帮助股票经纪决策买入或售出股票。
有些采用如上方式进行投资预测的公司,很注重节约实施成本,例如使用云平台(如AWS),先从很小数量的服务器开始,随着获益增长,逐步提高投入。一位我认识的分析师,从一家大投行离职创业后,在不到六个月的时间内,仅仅使用非常有限的投入,创立了一个盈利良好的大数据交易系统。
即便在传统制造领域,大数据仍然可以提升预测能力。我曾经担任过顾问的某欧洲一线汽车制造厂商,通过建立一个钢材交易成本的分析系统,选择更好的时机,以更优价格买入原材料。这个系统由开源Java框架Hadoop创建,整合了多个供应商的共计15Tb的数据,在两年内为该公司节省了1600万美元。
这个项目的成功主要有两个原因:首先,公司有足够的信息为所有的供应商建模;其次,该项目节省的原材料成本超过了实施这个项目的费用。
公司为何因为大数据亏钱
然而,并非每个大数据项目都会这样成功。公司在大数据项目上以亏损告终的概率,有时和成功的概率相差无几。大数据项目失败的早期症状有很多种,最常见的问题如:
步子迈太大:大数据并不需要一笔巨大的预算,如果怀着巨大的投入将带来巨大回报的预期开始一个大数据项目,往往会产生问题。在正式开始前,明智的做法是,尝试用有限的投入,在小范围内测试这个技术是否确实能带来预期的收益。按这样的节奏,一个项目可以按部就班地随着收益逐步提高,而逐步扩大投入规模,确保收益始终大于投入。
低估人力投入:在开始实施一个大数据系统前,问自己一个简单的问题:这个项目是否可以不需要持续的人工支持来运作?如果答案是,需要人工支持,那么建议停止项目。建立这样一个项目往往意味着百万级的损失,无法在有利润情况下保持维护和运行。
迷信自然语言处理:大数据有个经常听到的功能是,通过自然语言处理,将各种领域的各种数据处理成直接可读可理解的形式。这听起来确实很赞,但是在实际应用中,往往不尽如人意。自然语言处理仍然存在许多妨碍应用的限制,主要由于人工智能的发展还不够--而且在可见的10年内,这个情况可能不会有很大改观。
现代大数据项目具备巨大的节约成本的潜力,其效果对于过去的数据处理方式而言有如童话。但需要谨记的是,在投入时间和资源到大数据项目之前,首先要确认你的项目是收益大于成本的。只有傻瓜才会匆匆对一个点子一见钟情并倾其所有。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21