
为什么多数大数据项目以失败告终
几乎每个人的心目中,大数据就是企业IT部门的大大小小的结构化和非结构化数据,而且其量正在成倍的增长。但是,尽管大数据已然成为了一种主流的IT现象,多数的大数据项目仍然以失败而告终。
究其原因,就在于企业很难找到适当的方法进行大数据的收集、管理和理解,并最终从大数据信息中提取出有价值的东西。
征服大数据项目,并最终从中提取出您企业所需要的业务洞察力本身就是一项非常艰巨的任务。但当涉及到定义大数据项目的范畴,以及确保相关配套设施到位方面时,您企业的相关人员无法保持统一的步伐,那么,该项目注定是要失败的。
失败的原因分析
如下,是我所看到的大数据项目失败的主要原因:
缺乏一致性。在解决业务部门的相关问题方面,IT部门缺乏与业务部门的一致性。IT部门仅仅只是从技术的角度来看待问题。同样,缺乏企业利益相关者的真正的承诺也往往使得大数据项目很难成功。
缺乏数据访问权限。对数据的访问往往是受限制的,IT团队成员没有访问相关数据集的权限,以致他们无法找到能将使该项目成功的相关数据。
缺乏专业知识。鉴于许多在大数据领域的技术、方法和学科都是新的,导致企业的员工缺乏如何处理数据,完成业务的相关专业知识。
缺乏一致性
上述所有这些问题中,第一条,缺乏一致性。是您的企业必须首先解决的问题,而且也是最为重要的问题。问题的关键在于,您企业当前所探索和寻找的东西都是您不熟悉的领域,所以,要想获得大数据项目的成功,首先搞清楚您的业务部门到底是要解决什么问题是至关重要的。
虽然其是您企业大数据项目成功的最重要的因素,要想实现企业业务部门和IT部门之间的一致性也是相当具有挑战性的。不仅仅是因为大数据对于不同的人有着不同的意义,同时,还在于一系列外部因素可能会影响业务需求的变化,使得处理某些问题的优先级超出了IT部门所能保持的步伐。如果IT部门与业务部门在大数据项目所涉及的范畴方面无法达成一致,该项目就会涉及到太多的方向、太多的人,以至于会将重点从解决具体的业务问题变为对IT技术的管理,以便能够实现每个人的需求。
另外一个影响业务部门和IT部门之间的一致性的挑战来源于不愿意发生改变。很多时候,如果一个大数据项目建议采取相关的行动或变革,而业务部门的利益相关者不理解所涉及到的相关行动或变革,他们往往可能采取消极怠工的方法,首先默默的接受这一建议,但在之后将其贬为一个错误的进程,分析或数据集。对此,分析师团队则可能认为该业务部门已经同意并付诸相关行动了,只是他们所采取的行动所带来的结果只是产生了次优的业务成果。
缺乏数据访问权限
大数据项目失败的第二个原因——缺乏数据的访问权限可以追溯到一个基本的IT前提:筒仓。销售部门、营销部门、人力资源部门等都有数据仓库,每个部门的数据仓库都限制了相关数据的访问权限和保护措施。数据仓库存在的理由很好理解,但是如果IT部门所需要的数据仓库的某些相关数据不可用,那么,可以说在IT部门的员工试图解决某些问题前,就已然注定了他们无法解决这些问题了。
为了应对这一问题,大数据项目必须从一开始就具备相关数据的执行权。如果无法对所有业务相关数据进行访问,也就无法找出业务问题的关系和模式,也就无法解决业务部门所面临的问题了。所以,大数据项目的授权要来自企业的高层,如果企业高层发话说:“某个业务团队正在寻找解决某个相当重要的特定业务问题,IT部门就有足够的机会获得他们所需要的任何数据的访问权限了。”如果无法获得正确的数据信息,该项目无疑将长时间处于停滞状态。
缺乏专业知识
第三大缺陷——缺乏相关专业知识。这其实是源于企业缺乏合适的拥有正确的技能来执行大数据项目的人材。而由于大数据技术对于“主流”企业来说仍然是很新的,IT团队往往缺乏相关的专业知识来确定如何用大数据来达到分析的目的。
虽然招聘数据科学专家是解决这种专业知识的不足一种可能性的备选方案,但对于许多企业来说是不可行的。这一新的角色需要结合程序员的技能和调查研究科学家的思维,企业专门设置一个这样的职位的代价会非常高,同时其所需的相关技能设置也不常见,很难创建。
如何使您企业的大数据项目成功
考虑一个切实可行的办法。首先,不要将其称之为是一个“大数据项目”。将其命名为一个类似的项目名称:例如“一个帮助我们更好的了解我们的客户、以及为什么他们会喜欢在某个特定的商店购物的项目。”该项目是要回答重要的业务问题,而大数据便是答案的来源。如下,有一些最佳实践方案来帮助您的项目实现成功:
从列出一个您所想要解决的业务问题的清单入手
不要从解决某个大问题着手。从启动一个小的项目开始,选择一个您所亟待解决的具体的问题,并坚持下去。列出一份您所需要解答的问题的列表清单,并且不要因为被技术问题困住而忽视您的目标。确保IT团队的工作职责不会变得过于宽泛或所谓的“全方位”,这样可以尽量避免处理问题范围的改变进而导致的项目失败:即从业务部门到IT部门的需求的改变导致问题焦点的转移。确保所有利益相关方在客观上对于项目的实施和执行都是同意的,以便让每个人都能够专注于项目的完成。
在您开始项目之前获得企业高层的背书
一旦您已经确定您所要解决的业务问题,必须获得业务团队从上而下的对于您所需要的所有相关数据的支持,以保证成功完成项目。务必获得公司高层领导对于访问所有相关的业务数据的授权,以便您可以找到相关的模式和关系,进而解答业务问题。也就是说您必须获得访问、控制的权限。
确保您的团队具备执行项目所需的专业知识
理想的情况下,您的团队内部将会有成员接受过专业的训练,具备数据科学家的技能和心态,能够利用这些数据信息来生成所需的业务结果。如果不是的话,您可以利用您现有的系统来解决的问题。这是一个很好的退后一步来思考所需要解答的业务问题的时机。您可能在这时不需要经过专业的培训或NLP就能够得到您需要的答案,只是授予了合适的人员来访问企业内部的数据信息而已。
选择一个能够创造商业价值的问题,并在您已经正确的道路上持续的坚持下去。记住,一个成功的项目与其所涉及的范围是没有太大关系的。没必要一口气吃个胖子,那样反而会带来更大的失败。毕竟,一个小项目的成功要比一个大项目的失败要好得多。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01