
对待大数据:抛砖引玉 循序渐进
大数据带来的强大功能令人难以抗拒,它承诺将规模庞大且持续增长的数据转化为能为企业所利用的、涉及业务方方面面的宝贵情报。然而,这种诱惑的背后同样可能存在陷阱;如果不做详尽规划,技术消费很可能成为拖累企业的沉重包袱。
“大数据常常也带来巨大的消费风险,”NPI公益发展组织的IT采购管理顾问Jeff Muscarella指出。Muscarella警告称,即使是在用户已经对硬件、软件以及服务等内容支付过费用,大数据项目仍然能够轻而易举地带来百万美元级的增项支出。此外,不要被供应商拿出的所谓实际案例所蒙蔽,深入研究你可能会发现这些实例根本不像厂商吹嘘的那么出彩。“在大部分情况下,只要我们能抽丝剥茧地将案例分解进行调查,就会意识到其中有很多虚假的成分,”他解释道。
当然,这并不是说我们不该尝试引入大数据技术,Muscarella补充称。不过企业在着手进行采购之前,务必要深入研究、广泛收集信息。我们当然不应该为了花钱而花钱,只有在大数据项目确实能为业务提升带来帮助的前提下,这样的大动作才有意义。
“这不仅仅是一种新技术,”Muscarella表示。“确切来说,这是一种专为解决那些我们无法确定是否存在的业务问题而衍生的技术,CIO们一定得清楚这一点。目前对于大多数IT领导者来说,大数据究竟能带来哪些好处、其运作机制如何等等仍然是相当陌生的话题,甚至仅仅停留在概念层面。因此在部署之前,决策者必须勇于提问:新技术真能提升效益吗?如何提升、需要多长时间才能见效?在部署工作中,我们需要安排哪些基础设施建设?IT领导者们必须拿出一百二十分的关注度应对这类新项目,只有这样大数据这只“钱老虎”才可能真正为企业带来投资回报。
对待大数据:抛砖引玉、循序渐进
初次探索大数据项目时,千万别一起手就搞得声势浩大、劳民伤财,Muscarella提醒道。最好的方法是用Apache Hadoop这类开源工具先弄个试点案例,看看究竟收效如何。
“谁的钱也不是大风吹来的,所以相信各位一定希望投资能切实见效,”Muscarella指出。“先选一些可管理性较强的工具,小范围验证自己对大数据的认识。举例来说,如果我们的确能从试点案例中发掘到数据的价值、网络点击量的背后意义或者用户的消费习惯,接下来再深入思考如何利用这些结论改善企业的业务流程。”
“千万不要陷入无限升级基础设施的怪圈,这种倾向非常危险,”他补充道。“先验证效果,再回头规划自己的具体实施方案。即使最后的结果证明大家一开始的选择是正确的,我们也不必为搞试点而后悔。毕竟这么做最稳妥、风险最小,明智的管理者绝不会在项目还充满不确定因素时就盲目加大资金投入。”
一旦业务需求核准完毕,接下来我们才能开始讨论大数据项目需要哪些基础设施支持。大数据项目的规模往往以PB、甚至是EB计,因此大家必须保证自己的存储基础设施能够跟上这种庞大的资源需求。Muscarella认为,尽管供应商们总是奉劝用户使用同一家存储服务商的产品以提高设施标准化程度,但他仍然建议我们利用存储虚拟化技术将竞争机制引入产品选择。这样我们不仅能够有效降低风险,更不必劳神于某一家服务商的架构能否适应未来的技术发展趋势。
“不要指望通过一家供应商获得所谓的标准化,”他表示。“最科学的办法是将资源需求分散解决,一部分交给云平台、另一部分交给企业内部的数据中心。总之,一定要让自己手头拥有足够的选择权,否则一旦被套牢,大家很可能就此泥足深陷。”
说到这里,他结合自身经历举了个实例。原先他曾为一家医院处理IT事务,当时院方领导就坚持采用同一家服务供应商的标准化产品。项目初期形势看起来还不错,他告诉我们,然而在经过数年的逐步升级后,院方终于发现自己已经被牢牢套死在同一家供应商手上。尽管到这时产品与服务已经与他们的需求相去甚远,但情况已经无法逆转,供应商已然掌握了所有的主动权。[page]
“可以说,大家手中的备选方案越多,服务所带来的实际效果也就越好,”Muscarella评论道。“因此务必尽量使用多家服务厂商。另外,在确定升级周期等后续细节时,一定要在协议中努力为自己争取权益;只有让供应商明白我们其实随时可以选择其它服务,他们才会尽心竭力、老老实实地支持我们的业务。”
值得一提的是,存储机制同样需要倾注我们的心力与管理策略。首先,确保我们的设备支持费用处于合理的范围;其次是弄清楚存储产品组合方案中淘汰掉的硬件如何处理、采用什么样的周期,并在谈判中努力维护自己的利益、严格控制硬件成本。
在购置数据收集及分析类商务智能软件时,不妨先花点小钱做做评估
数据发掘及商务智能软件与服务在商业实例中经常会用到。也就是说供应商在兜售这类产品时,肯定会列举商业实例;而为了进一步打动企业客户,他们还要“附赠”免费业务分析服务,Muscarella指出。他们会派出几位顾问,对大家的企业环境及业务流程进行为时数天的调查;基本上他们的工作重点就是跟企业决策者聊天,并帮助部门主管了解他们的产品能为日常工作带来哪些提升或者便利。
“这是一帮老手,他们有办法把你哄得开开心心,并乖乖交出钱来,”Muscarella戏谑道。“但实际上这帮营销人士所做的案例分析往往漏洞百出,为了推销自己的产品他们经常夸大实际情况。即使是最厚道的供应商顾问也难免会把过分乐观的假设当成事实讲给我们听。”
他认为,最好的办法是花钱聘请这些供应商顾问或者第三方服务商对业务改善情况进行分析与评估。如此一来,他们就需要对自己的新差事负责,细心寻找案例中模棱两可的部分。而我们则能够从更诚实、更完整的评估结论中了解真实情况。
小心大数据中的捆绑销售
无论是购买硬件、软件还是服务,都一定要当心其中潜在的捆绑销售陷阱,Muscarella提醒道。
“提防捆绑销售!这句话我这辈子已经记不清说过多少遍了,”他告诉我们。狡猾的供应商们常常会在客户购买某些产品后,大方地提供数款某一时段内可以免费使用的工具。“用得开心吗?别高兴得太早。一年之后,他们就会检查客户安装并使用了多少款工具,并要求对这些工具收取维护费用。抱着占便宜的心态,企业客户在挑选免费工具时往往不计数量,这就导致他们使用了很多其实根本不必要的产品。而再过几年,整个过程反复循环,客户手头的多余工具也将逐渐累积。到这个时候,光是维护费用就很可能压得人叫苦不迭了。”
出于这种考虑,我们一定要保证所有支出都有经过严格核对,并在交易确立前认真考量一切时间及资金投入。Muscarella认为,从这资金方面入手能够反映供应商对该项目的重视程度,而从时间入手则能让我们了解供应商部署项目所需要的资源及任务,这些宝贵的信息会带来极大的参考价值。一方面,我们可以根据这些信息猜度基本售价、利润率与供应商所能接受的折扣范围;而另一方面,我们对于项目的透彻理解能够让自己在谈判桌上占尽优势,并以最有利于企业的角度拿下业务发展所必需的重要技术。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA 数据分析师:善用 Power BI 索引列,提升数据处理与分析效率 在 Power BI 数据分析流程中,“数据准备” 是决定后续分析质量 ...
2025-08-18CDA 数据分析师:巧用 SQL 多个聚合函数,解锁数据多维洞察 在企业数据分析场景中,单一维度的统计(如 “总销售额”“用户总数 ...
2025-08-18CDA 数据分析师:驾驭表格结构数据的核心角色与实践应用 在企业日常数据存储与分析场景中,表格结构数据(如 Excel 表格、数据库 ...
2025-08-18PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11