京公网安备 11010802034615号
经营许可证编号:京B2-20210330
如何成功做一个大数据项目
说有一个大数据分析师,他上了一架飞机,上飞机不久,广播里就传来机长的声音说,“对不起大家,我们飞机刚刚有一个引擎不工作了,但是不要着急,我们还可以用其它三个引擎飞,只是我们需要到达目的地的时间要比原来预计的晚一个小时”。又过了一会儿,机长开始播音了,对不起,我们刚才发现又有一个引擎坏了,但是没有问题,没有麻烦的,我们顶多到达目的地的时候会迟到两个小时。又过了不久,机长又说,现在有一个坏消息,现在只剩一个引擎了,但是不用担心,我们还是会安全到达目的地,只不过比原来预计的落地时间迟三个小时。然后这个大数据分析师就说,哇……,我希望不要再丢掉最后一个引擎,不然的话,我们就会永远在天上待着了。无法到达目的地就是这个意思了。
这个笑话本身是在讲数据如何能够让我们对未来的预测做出一些反应,最重要的是从企业的需求和未来业务的发展角度,讨论如何做一款比较成功的大数据项目,市场上这类的讲座和交流还比较少,希望至少对大家有所启发。
根据在美国做了15年的大数据项目、产品研发和管理,以及其它一些相关的数据分析的工作经验,了解到的其它的做的比较成功的和失败的项目,跟大家做一个经验分享。基本上大数据项目失败的特征主要是五个:
一是大数据项目与企业战略脱节,完全是领导或者是不知道那个部门的决策人突然脑子一热,就说别人在用,我们也做一个,根本没有把该做的项目和企业的商业战略、科技战略等各个方面结合起来。在项目无法与战略协调,无法在战略的指导下做一款产品或者是服务项目的时候,失败的可能性会非常大。
二是大数据商业用例不是很明确。商业用例是说大数据项目怎么能够帮助各项业务达成所需要的功能和目标,或者叫目的,这个不是很清楚,怎么帮助我不是很清楚,这样的话,就直接影响到你选什么样的数据,怎么用这些数据,以至于用了以后怎么去支持你的业务,这一点是第二条,也是关键的。
三是无法发掘出大数据特殊价值。如果你没有发掘出特殊价值,其实用小数据也可以做到,这个项目本身就失去了意义。
四是企业内部对大数据项目无共识。财务部门、营销部门、研发部门之间的利益和工作重点是不一样的,没有共识就很难顺利推进一个项目,最后就很有可能是拖延或者是取消,甚至是失败,推出去了内部员工没人买单。
五是缺乏项目所需核心技术。大数据不是谁都能玩儿得起的,如果缺乏核心技术,达不到自己的预期目标,钱也是白花的。
成功很多时候跟失败是反过来的:
一是项目用例(目标/实用价值)清晰。
从上到下,大家都明白这个大数据要做什么,包括企业的财务主管和具体业务部门,比方说营销部门,这个大数据项目是用在营销部门的,他们也很清楚,负责执行的技术部门也很清楚,这个搞清楚了以后,对大家上下一心做好项目是非常重要的。
二是项目规划完善+快速迭代研发试错稳步推进。
一个项目规划的时候,不要做成规划三个月、六个月,你用传统的老办法去做,最后发现实际上第一阶段结束了以后,你去做测试完全没有达到你想要的效果。我们做一个大项目要用快速迭代的方法来做,每个星期可以推出一个功能,进行快速测试,内部市场、外部市场都测试成功,下一个星期就可以进行下一个功能的研发、扩展、推广。这样的话,可以通过迅速的试错,比方说第二个星期做的方向不对,或者有些功能没有办法实现,或者跟我设计的不一样,这样的试错代价会比较低,不会等到6个月才发现有重大的错误,调整了以后第三个星期可以接着来,可以换一个方向,可以调整开发的内容,或者是功能,三个月以后,已经经过了四、五个星期的测试和研发了,基本上犯错的可能性就比较低了。
三是所选技术符合大数据项目功能要求。
很多人都听说过要上一个大数据项目必须要用一些特殊的技术,大数据项目最重要的不是选高大上的平台,或者是特殊的技术,最重要的是选一款符合最初设计的业务功能的技术,这个技术可能相对来说比较简单,可能是SAS软件,或者是JAVA程序,没必要上高大上的技术,最重要的是符合你的要求。很多企业选了高大上,最后发现,实际上钱花了很多,但是没有达到预期的要求,因为你选了高大上的东西以后,会影响到各个方面的整合和所需要的数据量,预算会很大,成本也会比较高,很难实现盈利的目标。所以最重要的是选一款适合你这个项目目标的技术,这个非常重要。
四是项目团队拥有各方面专业知识技能。
大数据技术就像企业做的任何一款创新产品和项目一样,需要雇佣所有的对这个项目有贡献的,可能会受影响的资源,可能包括人力资源,包括技术资源,包括市场资源,包括运营资源等等各个方面的资源调动,形成这么一个团队,上面有领导的支持,中间有大家的共识,最下面的一线执行人员也很清楚自己要做什么,这方面要协调好,要有专门的技术,这个很重要。
五是项目成果获得业务用例期望成果。
这个项目做了三个月、六个月,做出来了,是不是获得了业务用例期望的结果,是一个非常重要的标志。很多时候,很难是百分之百,一般80%的项目达不到完全预期的结果,可能是80%的预期达到了,那已经很好了,可能达到50%,也不错,因为是一个创新的项目,可以根据达到的预期项目进行不停地调整,最差的是只达到了20%,很多企业做的项目结果,这是一个统计的结果,是大家能看得见的。根据业界的标准,到了50%基本上算比较成功了,到了80%就是相当好了。
成功大数据的横向标准是五点:
一 是项目在预定的时间里可以实现或者接近预定的目标;
二 是这个项目或者产品实现了传统数据方法没有办法带来的特殊的内部和外部的商业价值;
三 是在有限的大数据投资的条件下,给特定的业务带来的好处可以轻松复制到其它的业务领域,比如说营销部门获得的成功会推广到产品的研发部门,或者是推广到业务运营部门,这样会花很小的代价,但是做了更多的事儿。
四 是受益的业务部门可以运用大数据工具进行高效便捷的工作,这其实是最直接了当的,因为本来我们要做一款大数据的产品,或者是服务项目就是为了提高运营效率和工作效率。
五 是通过这个项目实施企业获得了新的商业模式和成长点,这个是最重要的,从战略的角度讲,这个大数据产品和项目成功实现了企业转型和升级。
成功大数据的路线图分为六步:
第一步:确定对企业业务有重大影响的大数据用例和创新方向。
第二步:我们要制定基于大数据项目的详尽的产品服务创新规划。
第三步:要详细了解大数据项目所需要的业务功能要求和选择与之相匹配的技术。
第四步:就大数据项目带来的商业利益在企业内部达成共识。
第五步:我们要选择容易实现的目标入手,快速迭代研发、试错、稳步推进。也就是说不要刚开始就要搞高大上、大而全的项目,因为失败的几率几乎是百分之百,非常容易失败,因为预算太大,选的工具太复杂,调动的资源很多,很难一下子实现所有的目标,所以通常我们从一个晓得目标,容易实现的目标开始,这样可以鼓励士气,错误犯在研发的初期,而不是在中期和最后,这个最重要。
第六步:做大数据项目和产品一定要挖掘和实现大数据能给我们带来的特殊价值,这是其它的方法或者是其它类的数据做不到的,只有实现了这种特殊的价值,我们才能实现业务所需要的具体功能,不管是扩展市场的份额,或者是更精准的了解你的客户需求,还是说你要增加边际利润率,或者是提高产品上市的速度,缩短研发周期,这些都是大数据可以做的。另外就是跨界创新,传统企业可以通过大数据这个纽带跟其他企业的业务结合起来。
其实有很多精彩的实战案例,我把美国福特公司去年以来做的一个大数据项目跟大家分享一下。我在福特有一个非常熟悉的朋友,我也介入了一点点,我来讲一下,他们基本上是按照我总结的几步来做的。
福特第一步是确定了大数据用例,销售部门很想知道我怎么用大数据这个技术来提升汽车销售业绩,这是一个非常简单的业务用例。我们需要界定的是,一切影响销售业务的大数据,一般汽车销售商的普通做法是投放广告,看看影响力怎么样,动辄就是几百万,但是具体很难分清楚到底每一个受众看了这个广告以后会不会产生购买这个汽车的冲动,这个很难看到。大数据技术不太一样,它可以通过对某个地区的房屋市场、新建住宅、库存和销售数据、这个地区的就业率等各种相关的,可能会影响购买汽车意愿的原数据进行分析和收集,还可能会到跟汽车所有相关的网站上搜索,哪一种汽车,哪一种模式,哪一种款式,客户搜索了哪些汽车的价格,车型配置、汽车功能、汽车颜色等等这些客户喜好的数据。
福特汽车用这些方法把所有的数据都界定好了以后,第二步是把项目交给了一个差不多200人的大数据分析专业团队,他们获取和搜索所需的外部数据,比方说第三方合同网站,区域经济数据、就业数据等等。
第三步是他们获得数据以后,就开始对数据进行建模分析、挖掘,为销售和决策部门提供精准可靠的角色选择和效果分析,也就是说,你选这个方法,可能获得的营销效果是怎么样的,他们做了大概几十种可能的分析。
第四步是营销部门和运营部门根据这些数据策划和实施有针对性的促销计划,比方说在某些区,某些州需求量特别旺盛的地方,他们有专门的促销计划,基本上这些促销计划都是根据某一个个体的需求量身订做的,非常非常精准,所以不需要花五、六百万美金,花出去了以后不知道谁感兴趣,只需要花五、六十万美金,就知道谁对这个汽车感兴趣,这个广告就送到电子邮箱和地区的报纸上了,非常精准。
最后一步是大数据营销的创新效果衡量,跟传统的广告促销相比,福特花了很少的钱,做了大数据分析产品,我们叫大数据的模型和分析工具,运用这种方法,大幅度的提高了汽车的销售业绩。他们不光在汽车的销售方面运用了大数据,比较成功,还有其它方面的应用,包括汽车的整车质量、保险费用、汽车运输状况、汽车的智能和驾驶模式等等,他们希望用这些数据帮助驾驶员降低保险成本,这样的话可以促进很多销售者对福特这个品牌的认可,扩大市场占有率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30