京公网安备 11010802034615号
经营许可证编号:京B2-20210330
企业大数据的实施要循序渐进
大数据带来的强大功能令人难以抗拒,它承诺将规模庞大且持续增长的数据转化为能为企业所利用的、涉及业务方方面面的宝贵情报。然而,这种诱惑的背后同样可能存在陷阱;如果不做详尽规划,技术消费很可能成为拖累企业的沉重包袱。
"大数据常常也带来巨大的消费风险,"NPI公益发展组织的IT采购管理顾问Jeff Muscarella指出。Muscarella警告称,即使是在用户已经对硬件、软件以及服务等内容支付过费用,大数据项目仍然能够轻而易举地带来百万美元级的增项支出。此外,不要被供应商拿出的所谓实际案例所蒙蔽,深入研究你可能会发现这些实例根本不像厂商吹嘘的那么出彩。
"在大部分情况下,只要我们能抽丝剥茧地将案例分解进行调查,就会意识到其中有很多虚假的成分,"他解释道。当然,这并不是说我们不该尝试引入大数据技术,Muscarella补充称。不过企业在着手进行采购之前,务必要深入研究、广泛收集信息。我们当然不应该为了花钱而花钱,只有在大数据项目确实能为业务提升带来帮助的前提下,这样的大动作才有意义。
"这不仅仅是一种新技术,"Muscarella表示。"确切来说,这是一种专为解决那些我们无法确定是否存在的业务问题而衍生的技术,CIO们一定得清楚这一点。目前对于大多数IT领导者来说,大数据究竟能带来哪些好处、其运作机制如何等等仍然是相当陌生的话题,甚至仅仅停留在概念层面。因此在部署之前,决策者必须勇于提问:新技术真能提升效益吗?如何提升、需要多长时间才能见效?在部署工作中,我们需要安排哪些基础设施建设?IT领导者们必须拿出一百二十分的关注度应对这类新项目,只有这样大数据这只"钱老虎"才可能真正为企业带来投资回报。
对待大数据:抛砖引玉、循序渐进
初次探索大数据项目时,千万别一起手就搞得声势浩大、劳民伤财,Muscarella提醒道。最好的方法是用Apache Hadoop这类开源工具先弄个试点案例,看看究竟收效如何。
"谁的钱也不是大风吹来的,所以相信各位一定希望投资能切实见效,"Muscarella指出。"先选一些可管理性较强的工具,小范围验证自己对大数据的认识。举例来说,如果我们的确能从试点案例中发掘到数据的价值、网络点击量的背后意义或者用户的消费习惯,接下来再深入思考如何利用这些结论改善企业的业务流程。"[page]
"千万不要陷入无限升级基础设施的怪圈,这种倾向非常危险,"他补充道。"先验证效果,再回头规划自己的具体实施方案。即使最后的结果证明大家一开始的选择是正确的,我们也不必为搞试点而后悔。毕竟这么做最稳妥、风险最小,明智的管理者绝不会在项目还充满不确定因素时就盲目加大资金投入。"
一旦业务需求核准完毕,接下来我们才能开始讨论大数据项目需要哪些基础设施支持。大数据项目的规模往往以PB、甚至是EB计,因此大家必须保证自己的存储基础设施能够跟上这种庞大的资源需求。Muscarella认为,尽管供应商们总是奉劝用户使用同一家存储服务商的产品以提高设施标准化程度,但他仍然建议我们利用存储虚拟化技术将竞争机制引入产品选择。这样我们不仅能够有效降低风险,更不必劳神于某一家服务商的架构能否适应未来的技术发展趋势。
"不要指望通过一家供应商获得所谓的标准化,"他表示。"最科学的办法是将资源需求分散解决,一部分交给云平台、另一部分交给企业内部的数据中心。总之,一定要让自己手头拥有足够的选择权,否则一旦被套牢,大家很可能就此泥足深陷。"
说到这里,他结合自身经历举了个实例。原先他曾为一家医院处理IT事务,当时院方领导就坚持采用同一家服务供应商的标准化产品。项目初期形势看起来还不错,他告诉我们,然而在经过数年的逐步升级后,院方终于发现自己已经被牢牢套死在同一家供应商手上。尽管到这时产品与服务已经与他们的需求相去甚远,但情况已经无法逆转,供应商已然掌握了所有的主动权。
"可以说,大家手中的备选方案越多,服务所带来的实际效果也就越好,"Muscarella评论道。"因此务必尽量使用多家服务厂商。另外,在确定升级周期等后续细节时,一定要在协议中努力为自己争取权益;只有让供应商明白我们其实随时可以选择其它服务,他们才会尽心竭力、老老实实地支持我们的业务。"
值得一提的是,存储机制同样需要倾注我们的心力与管理策略。首先,确保我们的设备支持费用处于合理的范围;其次是弄清楚存储产品组合方案中淘汰掉的硬件如何处理、采用什么样的周期,并在谈判中努力维护自己的利益、严格控制硬件成本。
在购置数据收集及分析类商务智能软件时,不妨先花点小钱做做评估
数据发掘及商务智能软件与服务在商业实例中经常会用到。也就是说供应商在兜售这类产品时,肯定会列举商业实例;而为了进一步打动企业客户,他们还要"附赠"免费业务分析服务,Muscarella指出。他们会派出几位顾问,对大家的企业环境及业务流程进行为时数天的调查;基本上他们的工作重点就是跟企业决策者聊天,并帮助部门主管了解他们的产品能为日常工作带来哪些提升或者便利。
"这是一帮老手,他们有办法把你哄得开开心心,并乖乖交出钱来,"Muscarella戏谑道。"但实际上这帮营销人士所做的案例分析往往漏洞百出,为了推销自己的产品他们经常夸大实际情况。即使是最厚道的供应商顾问也难免会把过分乐观的假设当成事实讲给我们听。"
他认为,最好的办法是花钱聘请这些供应商顾问或者第三方服务商对业务改善情况进行分析与评估。如此一来,他们就需要对自己的新差事负责,细心寻找案例中模棱两可的部分。而我们则能够从更诚实、更完整的评估结论中了解真实情况。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12