京公网安备 11010802034615号
经营许可证编号:京B2-20210330
对待大数据:抛砖引玉 循序渐进
大数据带来的强大功能令人难以抗拒,它承诺将规模庞大且持续增长的数据转化为能为企业所利用的、涉及业务方方面面的宝贵情报。然而,这种诱惑的背后同样可能存在陷阱;如果不做详尽规划,技术消费很可能成为拖累企业的沉重包袱。
“大数据常常也带来巨大的消费风险,”NPI公益发展组织的IT采购管理顾问Jeff Muscarella指出。Muscarella警告称,即使是在用户已经对硬件、软件以及服务等内容支付过费用,大数据项目仍然能够轻而易举地带来百万美元级的增项支出。此外,不要被供应商拿出的所谓实际案例所蒙蔽,深入研究你可能会发现这些实例根本不像厂商吹嘘的那么出彩。“在大部分情况下,只要我们能抽丝剥茧地将案例分解进行调查,就会意识到其中有很多虚假的成分,”他解释道。
当然,这并不是说我们不该尝试引入大数据技术,Muscarella补充称。不过企业在着手进行采购之前,务必要深入研究、广泛收集信息。我们当然不应该为了花钱而花钱,只有在大数据项目确实能为业务提升带来帮助的前提下,这样的大动作才有意义。
“这不仅仅是一种新技术,”Muscarella表示。“确切来说,这是一种专为解决那些我们无法确定是否存在的业务问题而衍生的技术,CIO们一定得清楚这一点。目前对于大多数IT领导者来说,大数据究竟能带来哪些好处、其运作机制如何等等仍然是相当陌生的话题,甚至仅仅停留在概念层面。因此在部署之前,决策者必须勇于提问:新技术真能提升效益吗?如何提升、需要多长时间才能见效?在部署工作中,我们需要安排哪些基础设施建设?IT领导者们必须拿出一百二十分的关注度应对这类新项目,只有这样大数据这只“钱老虎”才可能真正为企业带来投资回报。
对待大数据:抛砖引玉、循序渐进
初次探索大数据项目时,千万别一起手就搞得声势浩大、劳民伤财,Muscarella提醒道。最好的方法是用Apache Hadoop这类开源工具先弄个试点案例,看看究竟收效如何。
“谁的钱也不是大风吹来的,所以相信各位一定希望投资能切实见效,”Muscarella指出。“先选一些可管理性较强的工具,小范围验证自己对大数据的认识。举例来说,如果我们的确能从试点案例中发掘到数据的价值、网络点击量的背后意义或者用户的消费习惯,接下来再深入思考如何利用这些结论改善企业的业务流程。”
“千万不要陷入无限升级基础设施的怪圈,这种倾向非常危险,”他补充道。“先验证效果,再回头规划自己的具体实施方案。即使最后的结果证明大家一开始的选择是正确的,我们也不必为搞试点而后悔。毕竟这么做最稳妥、风险最小,明智的管理者绝不会在项目还充满不确定因素时就盲目加大资金投入。”
一旦业务需求核准完毕,接下来我们才能开始讨论大数据项目需要哪些基础设施支持。大数据项目的规模往往以PB、甚至是EB计,因此大家必须保证自己的存储基础设施能够跟上这种庞大的资源需求。Muscarella认为,尽管供应商们总是奉劝用户使用同一家存储服务商的产品以提高设施标准化程度,但他仍然建议我们利用存储虚拟化技术将竞争机制引入产品选择。这样我们不仅能够有效降低风险,更不必劳神于某一家服务商的架构能否适应未来的技术发展趋势。
“不要指望通过一家供应商获得所谓的标准化,”他表示。“最科学的办法是将资源需求分散解决,一部分交给云平台、另一部分交给企业内部的数据中心。总之,一定要让自己手头拥有足够的选择权,否则一旦被套牢,大家很可能就此泥足深陷。”
说到这里,他结合自身经历举了个实例。原先他曾为一家医院处理IT事务,当时院方领导就坚持采用同一家服务供应商的标准化产品。项目初期形势看起来还不错,他告诉我们,然而在经过数年的逐步升级后,院方终于发现自己已经被牢牢套死在同一家供应商手上。尽管到这时产品与服务已经与他们的需求相去甚远,但情况已经无法逆转,供应商已然掌握了所有的主动权。[page]
“可以说,大家手中的备选方案越多,服务所带来的实际效果也就越好,”Muscarella评论道。“因此务必尽量使用多家服务厂商。另外,在确定升级周期等后续细节时,一定要在协议中努力为自己争取权益;只有让供应商明白我们其实随时可以选择其它服务,他们才会尽心竭力、老老实实地支持我们的业务。”
值得一提的是,存储机制同样需要倾注我们的心力与管理策略。首先,确保我们的设备支持费用处于合理的范围;其次是弄清楚存储产品组合方案中淘汰掉的硬件如何处理、采用什么样的周期,并在谈判中努力维护自己的利益、严格控制硬件成本。
在购置数据收集及分析类商务智能软件时,不妨先花点小钱做做评估
数据发掘及商务智能软件与服务在商业实例中经常会用到。也就是说供应商在兜售这类产品时,肯定会列举商业实例;而为了进一步打动企业客户,他们还要“附赠”免费业务分析服务,Muscarella指出。他们会派出几位顾问,对大家的企业环境及业务流程进行为时数天的调查;基本上他们的工作重点就是跟企业决策者聊天,并帮助部门主管了解他们的产品能为日常工作带来哪些提升或者便利。
“这是一帮老手,他们有办法把你哄得开开心心,并乖乖交出钱来,”Muscarella戏谑道。“但实际上这帮营销人士所做的案例分析往往漏洞百出,为了推销自己的产品他们经常夸大实际情况。即使是最厚道的供应商顾问也难免会把过分乐观的假设当成事实讲给我们听。”
他认为,最好的办法是花钱聘请这些供应商顾问或者第三方服务商对业务改善情况进行分析与评估。如此一来,他们就需要对自己的新差事负责,细心寻找案例中模棱两可的部分。而我们则能够从更诚实、更完整的评估结论中了解真实情况。
小心大数据中的捆绑销售
无论是购买硬件、软件还是服务,都一定要当心其中潜在的捆绑销售陷阱,Muscarella提醒道。
“提防捆绑销售!这句话我这辈子已经记不清说过多少遍了,”他告诉我们。狡猾的供应商们常常会在客户购买某些产品后,大方地提供数款某一时段内可以免费使用的工具。“用得开心吗?别高兴得太早。一年之后,他们就会检查客户安装并使用了多少款工具,并要求对这些工具收取维护费用。抱着占便宜的心态,企业客户在挑选免费工具时往往不计数量,这就导致他们使用了很多其实根本不必要的产品。而再过几年,整个过程反复循环,客户手头的多余工具也将逐渐累积。到这个时候,光是维护费用就很可能压得人叫苦不迭了。”
出于这种考虑,我们一定要保证所有支出都有经过严格核对,并在交易确立前认真考量一切时间及资金投入。Muscarella认为,从这资金方面入手能够反映供应商对该项目的重视程度,而从时间入手则能让我们了解供应商部署项目所需要的资源及任务,这些宝贵的信息会带来极大的参考价值。一方面,我们可以根据这些信息猜度基本售价、利润率与供应商所能接受的折扣范围;而另一方面,我们对于项目的透彻理解能够让自己在谈判桌上占尽优势,并以最有利于企业的角度拿下业务发展所必需的重要技术。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08在数据驱动决策的链路中,统计制图是CDA(Certified Data Analyst)数据分析师将抽象数据转化为直观洞察的关键载体。不同于普通 ...
2026-01-08在主成分分析(PCA)的学习与实践中,“主成分载荷矩阵”和“成分矩阵”是两个高频出现但极易混淆的核心概念。两者均是主成分分 ...
2026-01-07在教学管理、学生成绩分析场景中,成绩分布图是直观呈现成绩分布规律的核心工具——通过图表能快速看出成绩集中区间、高分/低分 ...
2026-01-07在数据分析师的工作闭环中,数据探索与统计分析是连接原始数据与业务洞察的关键环节。CDA(Certified Data Analyst)作为具备专 ...
2026-01-07在数据处理与可视化场景中,将Python分析后的结果导出为Excel文件是高频需求。而通过设置单元格颜色,能让Excel中的数据更具层次 ...
2026-01-06在企业运营、业务监控、数据分析等场景中,指标波动是常态——无论是日营收的突然下滑、用户活跃度的骤升,还是产品故障率的异常 ...
2026-01-06在数据驱动的建模与分析场景中,“数据决定上限,特征决定下限”已成为行业共识。原始数据经过采集、清洗后,往往难以直接支撑模 ...
2026-01-06在Python文件操作场景中,批量处理文件、遍历目录树是高频需求——无论是统计某文件夹下的文件数量、筛选特定类型文件,还是批量 ...
2026-01-05在神经网络模型训练过程中,开发者最担心的问题之一,莫过于“训练误差突然增大”——前几轮还平稳下降的损失值(Loss),突然在 ...
2026-01-05在数据驱动的业务场景中,“垃圾数据进,垃圾结果出”是永恒的警示。企业收集的数据往往存在缺失、异常、重复、格式混乱等问题, ...
2026-01-05在数字化时代,用户行为数据已成为企业的核心资产之一。从用户打开APP的首次点击,到浏览页面的停留时长,再到最终的购买决策、 ...
2026-01-04在数据分析领域,数据稳定性是衡量数据质量的核心维度之一,直接决定了分析结果的可靠性与决策价值。稳定的数据能反映事物的固有 ...
2026-01-04在CDA(Certified Data Analyst)数据分析师的工作链路中,数据读取是连接原始数据与后续分析的关键桥梁。如果说数据采集是“获 ...
2026-01-04尊敬的考生: 您好! 我们诚挚通知您,CDA Level III 考试大纲将于 2025 年 12 月 31 日实施重大更新,并正式启用,2026年3月考 ...
2025-12-31“字如其人”的传统认知,让不少“手残党”在需要签名的场景中倍感尴尬——商务签约时的签名歪歪扭扭,朋友聚会的签名墙不敢落笔 ...
2025-12-31在多元统计分析的因子分析中,“得分系数”是连接原始观测指标与潜在因子的关键纽带,其核心作用是将多个相关性较高的原始指标, ...
2025-12-31对CDA(Certified Data Analyst)数据分析师而言,高质量的数据是开展后续分析、挖掘业务价值的基础,而数据采集作为数据链路的 ...
2025-12-31在中介效应分析(或路径分析)中,间接效应是衡量“自变量通过中介变量影响因变量”这一间接路径强度与方向的核心指标。不同于直 ...
2025-12-30