京公网安备 11010802034615号
经营许可证编号:京B2-20210330
警醒 大数据是如何赚钱和亏钱的_数据分析师考试
大数据无疑是时下炙手可热的流行词汇,然而,我们鲜少看到具体大数据如何带来收益,和具体如何实现的例子,这是怎么回事呢?
多年来,在经历了几个通信和投行的大数据相关早期实施项目后,我认为这个新兴技术的收益主要在于:实现对复杂系统更为精准的剖析,例如股票市场或供应链。(投行成为最早一批应用大数据分析的行业之一,可谓毫不意外。对利用技术提升效率,创造效益更为敏锐的商业模式,往往也是更赚钱的。)
在投行的日常工作中,为了精准地选择投资机会、选购股票,有大量对文档处理的需求,例如新闻简报,财务报表。如果人工进行,工作量过于庞大。因此助理分析师们往往简化他们的预测分析过程,并使用电子表格来完成绝大部分工作。通过大数据技术,投行可以整合各种信息,减少可能的(简化分析带来的)风险,从整体上带来更优越的分析和预测能力。
公司如何通过大数据赚钱
通过大数据平台,股票经纪和投资经理们可以聚合各种来源的非格式化数据,辅助判断哪些公司值得投资。所谓‘非格式化数据’包括如公司新闻,产品评论,供应商数据,价格变化,将这些信息以所谓“大数据”形式整合,通过建模,帮助股票经纪决策买入或售出股票。
有些采用如上方式进行投资预测的公司,很注重节约实施成本,例如使用云平台(如AWS),先从很小数量的服务器开始,随着获益增长,逐步提高投入。一位我认识的分析师,从一家大投行离职创业后,在不到六个月的时间内,仅仅使用非常有限的投入,创立了一个盈利良好的大数据交易系统。
即便在传统制造领域,大数据仍然可以提升预测能力。我曾经担任过顾问的某欧洲一线汽车制造厂商,通过建立一个钢材交易成本的分析系统,选择更好的时机,以更优价格买入原材料。这个系统由开源Java框架Hadoop创建,整合了多个供应商的共计15Tb的数据,在两年内为该公司节省了1600万美元。
这个项目的成功主要有两个原因:首先,公司有足够的信息为所有的供应商建模;其次,该项目节省的原材料成本超过了实施这个项目的费用。
公司为何因为大数据亏钱
然而,并非每个大数据项目都会这样成功。公司在大数据项目上以亏损告终的概率,有时和成功的概率相差无几。大数据项目失败的早期症状有很多种,最常见的问题如:
步子迈太大:大数据并不需要一笔巨大的预算,如果怀着巨大的投入将带来巨大回报的预期开始一个大数据项目,往往会产生问题。在正式开始前,明智的做法是,尝试用有限的投入,在小范围内测试这个技术是否确实能带来预期的收益。按这样的节奏,一个项目可以按部就班地随着收益逐步提高,而逐步扩大投入规模,确保收益始终大于投入。
低估人力投入:在开始实施一个大数据系统前,问自己一个简单的问题:这个项目是否可以不需要持续的人工支持来运作?如果答案是,需要人工支持,那么建议停止项目。建立这样一个项目往往意味着百万级的损失,无法在有利润情况下保持维护和运行。
迷信自然语言处理:大数据有个经常听到的功能是,通过自然语言处理,将各种领域的各种数据处理成直接可读可理解的形式。这听起来确实很赞,但是在实际应用中,往往不尽如人意。自然语言处理仍然存在许多妨碍应用的限制,主要由于人工智能的发展还不够--而且在可见的10年内,这个情况可能不会有很大改观。
现代大数据项目具备巨大的节约成本的潜力,其效果对于过去的数据处理方式而言有如童话。但需要谨记的是,在投入时间和资源到大数据项目之前,首先要确认你的项目是收益大于成本的。只有傻瓜才会匆匆对一个点子一见钟情并倾其所有。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04