京公网安备 11010802034615号
经营许可证编号:京B2-20210330
对待大数据:抛砖引玉 循序渐进
大数据带来的强大功能令人难以抗拒,它承诺将规模庞大且持续增长的数据转化为能为企业所利用的、涉及业务方方面面的宝贵情报。然而,这种诱惑的背后同样可能存在陷阱;如果不做详尽规划,技术消费很可能成为拖累企业的沉重包袱。
“大数据常常也带来巨大的消费风险,”NPI公益发展组织的IT采购管理顾问Jeff Muscarella指出。Muscarella警告称,即使是在用户已经对硬件、软件以及服务等内容支付过费用,大数据项目仍然能够轻而易举地带来百万美元级的增项支出。此外,不要被供应商拿出的所谓实际案例所蒙蔽,深入研究你可能会发现这些实例根本不像厂商吹嘘的那么出彩。“在大部分情况下,只要我们能抽丝剥茧地将案例分解进行调查,就会意识到其中有很多虚假的成分,”他解释道。
当然,这并不是说我们不该尝试引入大数据技术,Muscarella补充称。不过企业在着手进行采购之前,务必要深入研究、广泛收集信息。我们当然不应该为了花钱而花钱,只有在大数据项目确实能为业务提升带来帮助的前提下,这样的大动作才有意义。
“这不仅仅是一种新技术,”Muscarella表示。“确切来说,这是一种专为解决那些我们无法确定是否存在的业务问题而衍生的技术,CIO们一定得清楚这一点。目前对于大多数IT领导者来说,大数据究竟能带来哪些好处、其运作机制如何等等仍然是相当陌生的话题,甚至仅仅停留在概念层面。因此在部署之前,决策者必须勇于提问:新技术真能提升效益吗?如何提升、需要多长时间才能见效?在部署工作中,我们需要安排哪些基础设施建设?IT领导者们必须拿出一百二十分的关注度应对这类新项目,只有这样大数据这只“钱老虎”才可能真正为企业带来投资回报。
对待大数据:抛砖引玉、循序渐进
初次探索大数据项目时,千万别一起手就搞得声势浩大、劳民伤财,Muscarella提醒道。最好的方法是用Apache Hadoop这类开源工具先弄个试点案例,看看究竟收效如何。
“谁的钱也不是大风吹来的,所以相信各位一定希望投资能切实见效,”Muscarella指出。“先选一些可管理性较强的工具,小范围验证自己对大数据的认识。举例来说,如果我们的确能从试点案例中发掘到数据的价值、网络点击量的背后意义或者用户的消费习惯,接下来再深入思考如何利用这些结论改善企业的业务流程。”
“千万不要陷入无限升级基础设施的怪圈,这种倾向非常危险,”他补充道。“先验证效果,再回头规划自己的具体实施方案。即使最后的结果证明大家一开始的选择是正确的,我们也不必为搞试点而后悔。毕竟这么做最稳妥、风险最小,明智的管理者绝不会在项目还充满不确定因素时就盲目加大资金投入。”
一旦业务需求核准完毕,接下来我们才能开始讨论大数据项目需要哪些基础设施支持。大数据项目的规模往往以PB、甚至是EB计,因此大家必须保证自己的存储基础设施能够跟上这种庞大的资源需求。Muscarella认为,尽管供应商们总是奉劝用户使用同一家存储服务商的产品以提高设施标准化程度,但他仍然建议我们利用存储虚拟化技术将竞争机制引入产品选择。这样我们不仅能够有效降低风险,更不必劳神于某一家服务商的架构能否适应未来的技术发展趋势。
“不要指望通过一家供应商获得所谓的标准化,”他表示。“最科学的办法是将资源需求分散解决,一部分交给云平台、另一部分交给企业内部的数据中心。总之,一定要让自己手头拥有足够的选择权,否则一旦被套牢,大家很可能就此泥足深陷。”
说到这里,他结合自身经历举了个实例。原先他曾为一家医院处理IT事务,当时院方领导就坚持采用同一家服务供应商的标准化产品。项目初期形势看起来还不错,他告诉我们,然而在经过数年的逐步升级后,院方终于发现自己已经被牢牢套死在同一家供应商手上。尽管到这时产品与服务已经与他们的需求相去甚远,但情况已经无法逆转,供应商已然掌握了所有的主动权。[page]
“可以说,大家手中的备选方案越多,服务所带来的实际效果也就越好,”Muscarella评论道。“因此务必尽量使用多家服务厂商。另外,在确定升级周期等后续细节时,一定要在协议中努力为自己争取权益;只有让供应商明白我们其实随时可以选择其它服务,他们才会尽心竭力、老老实实地支持我们的业务。”
值得一提的是,存储机制同样需要倾注我们的心力与管理策略。首先,确保我们的设备支持费用处于合理的范围;其次是弄清楚存储产品组合方案中淘汰掉的硬件如何处理、采用什么样的周期,并在谈判中努力维护自己的利益、严格控制硬件成本。
在购置数据收集及分析类商务智能软件时,不妨先花点小钱做做评估
数据发掘及商务智能软件与服务在商业实例中经常会用到。也就是说供应商在兜售这类产品时,肯定会列举商业实例;而为了进一步打动企业客户,他们还要“附赠”免费业务分析服务,Muscarella指出。他们会派出几位顾问,对大家的企业环境及业务流程进行为时数天的调查;基本上他们的工作重点就是跟企业决策者聊天,并帮助部门主管了解他们的产品能为日常工作带来哪些提升或者便利。
“这是一帮老手,他们有办法把你哄得开开心心,并乖乖交出钱来,”Muscarella戏谑道。“但实际上这帮营销人士所做的案例分析往往漏洞百出,为了推销自己的产品他们经常夸大实际情况。即使是最厚道的供应商顾问也难免会把过分乐观的假设当成事实讲给我们听。”
他认为,最好的办法是花钱聘请这些供应商顾问或者第三方服务商对业务改善情况进行分析与评估。如此一来,他们就需要对自己的新差事负责,细心寻找案例中模棱两可的部分。而我们则能够从更诚实、更完整的评估结论中了解真实情况。
小心大数据中的捆绑销售
无论是购买硬件、软件还是服务,都一定要当心其中潜在的捆绑销售陷阱,Muscarella提醒道。
“提防捆绑销售!这句话我这辈子已经记不清说过多少遍了,”他告诉我们。狡猾的供应商们常常会在客户购买某些产品后,大方地提供数款某一时段内可以免费使用的工具。“用得开心吗?别高兴得太早。一年之后,他们就会检查客户安装并使用了多少款工具,并要求对这些工具收取维护费用。抱着占便宜的心态,企业客户在挑选免费工具时往往不计数量,这就导致他们使用了很多其实根本不必要的产品。而再过几年,整个过程反复循环,客户手头的多余工具也将逐渐累积。到这个时候,光是维护费用就很可能压得人叫苦不迭了。”
出于这种考虑,我们一定要保证所有支出都有经过严格核对,并在交易确立前认真考量一切时间及资金投入。Muscarella认为,从这资金方面入手能够反映供应商对该项目的重视程度,而从时间入手则能让我们了解供应商部署项目所需要的资源及任务,这些宝贵的信息会带来极大的参考价值。一方面,我们可以根据这些信息猜度基本售价、利润率与供应商所能接受的折扣范围;而另一方面,我们对于项目的透彻理解能够让自己在谈判桌上占尽优势,并以最有利于企业的角度拿下业务发展所必需的重要技术。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11