京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据带给企业的风险_数据分析师
“大数据”。这是最新的IT流行语,而原因也不难理解。更快、更深入地解析更多信息的能力,使企业、政府、研究机构等能够以一种以前只能想象的方式去理解这个世界。
这些都是事实。不过呢……
还有一种情况同样也是事实:在争先恐后拥抱大数据的各种可能性之际,我们或许忽略了大数据带来的挑战,比如企业怎样解读信息,怎样管理数据带来的政治问题,以及怎样寻找必需的人才来理解新信息的洪流。
也就是说,大数据为数据分析的游戏增添了更大额的赌注。侵犯隐私的可能性增加,在快速变幻的市场中的财务敞口加大,把噪音当真知灼见的可能性增加,把大量金钱和时间用于界定不清晰的问题或机会的风险加大。
如果不明白、不化解这些挑战,我们就会面临这类风险:将本来有望强化组织的一切数据变成一种牵扯精力的东西,一种幻象,或者是一场伤筋动骨的权力争夺。
请允许我更具体地说说这些挑战。
找到有能力使用Hive、Pig、Cassandra、MongoDB或Hadoop等数据分析工具的人才只是整个洋葱的第一层。没有几家公司的内部专家能够从业务角度证明花钱聘请大数据专家的价值,更不用说对求职者的优劣展开评估。很多管理人员也缺乏基本的数学能力,所以如何找到能够掌握更复杂统计机制的决策者,也有可能是一种挑战。
让事情更加复杂的是,大数据工具还没有做好大范围推广的准备:它们仍在快速演化,大多数高校都没有教,供应商的支持不够理想,对用户灵活性的要求也高于更成熟的工具。考虑到这种情况,寻找合适人才的重要性只增不减。
洋葱的另一层:要让大数据发挥作用,程序员和分析师还要了解所涉行业的基本情况。比如说,一家制药企业的数据分析师注意到,近乎实时的销售终端数据显示1月份阿司匹林销量大增,于是他们说,流感愈演愈烈。但在调动销售资源开展大规模广告活动并增加产量之前,不妨把当前的销售型态与过去几年的情况做个比较。阿司匹林销量增加也可能是很多人在参加新年前夜的聚会之后出现了宿醉反应。如果分析师不了解业务以及应该问的问题,那么公司就有可能在花了很多钱之后一次次地走进死胡同。
最后一层是IT安全。如果说很多公司真的没有能力使用大数据工具,那么它们肯定也没有能力保障数据安全。收集到的信息越多,可能遭到泄露或窃取的信息也就越多。
人们常常认为掌握信息就会在组织内部掌握权力。显然,不管是谁来决定大数据时代该衡量哪些东西,这个决定者都会积累越来越大的权力。
另外,跨越组织边界的信息分享是大数据的属性之一,它可以颠覆传统的权力关系。
以一家在加拿大和美国各有一座工厂的公司为例。来自传感器的数据流显示加拿大工厂出产的发动机拥有97%的可靠性,美国工厂发动性的可靠性只有80%。突然之间,加拿大工厂管理人员在组织内部的地位可能就会升高,让美国工厂的管理人员感到惊慌。
公司的效益可能会得到改善,但高管必须做好管理内部政治的准备。
再举一个例子。大数据使人有机会衡量先前无法衡量的东西。如果一家大型零售企业现在可以更快速、更方便地衡量消费者对不同营销活动(不管是“超级碗”广告、杂志优惠券还是报纸广告)的反应,不同的利益相关者在组织内部的相对地位可能就会发生变化。他们也有可能对社交媒体团队产生憎恨,因为后者会用点击率数据来证明他们有能力或没有能力拉动销售收入。
原先要用几个月时间来规划、执行的流程现在可能只需几分钟就能评估完毕,将会进一步加剧上述颠覆过程。多年习惯了评估年度销售业绩的人常常很难应付每周甚至是每天的收入数据。按老一套办法管理的人可能会发现自己已经落伍于新的世界。
一旦知道信息即权力,有人可能就会投机取巧,损害公司的利益。
比如说,一家大公司开始以公司被推特(Twitter)提及的次数为指标来跟踪网站流量,跟踪结果在高管的推特活动一览表(dashboard)上持续更新。
一支销售团队的经理原先主要是通过贸易展会来获取线索并最终达成销售,然而当推特提及次数成为关键衡量指标之后,这位经理改变了部门的重点,宣称“我们要拿下dashboard”。到头来这个部门可能确实是拿下了dashboard,但这样一来,它强调的就不是曾经大获成功的展会,而是没有优质线索、无利可图的网站点击量和社交媒体流量。
普通数据库大约已经存在了35年的时间,所以人们有了很多经验,这些工具的理解和运用相对容易。相比之下,大数据还在萌芽阶段,所以组织、理解其深层意义的技术仍然处在起步阶段。
另外,理解如此大规模的信息也不是一件容易的事情。安全大师布鲁斯·施奇纳(Bruce Schneier)如此总结很多人的数学能力:“一个,两个,三个,很多个。”电子表格仍然是很多公司的主要定量分析工具,但它远远不足以用来实时衡量某个城市特定时刻道路上的汽车数量,或者是本周联邦政府在交通项目上的支出。
视觉化对于这类数据可以起到极大的帮助作用,但这个领域仍不成熟,其特殊语言也没有多少人懂得。
在如此大的规模层面上思考问题意味着什么?我们怎样才能学会针对主城道路上每一辆汽车、大型连锁零售店每一位顾客的智能手机、或配送车上每一个隔夜包裹所发出的信息提出问题?怎样才能让更多的商人学会按统计概率而非偶然事件思考?由于《点球成金》(Moneyball)这本书及同名电影的缘故,其中涉及的方法已经为球迷所熟知。但他们也将记得,这样的方法是怎样给一个组织带来了天翻地覆的变化,并被竞争对手模仿。
从某些意义上讲,它要求人们用一种全新的方式打量这个世界。
但优秀管理的原则也适用于大数据领域。在企业能够利用大数据获利之前,管理人员必须拒绝迷失在噪音当中,放任它掩盖客户、价值和执行这些基本力量。大数据的数量、速度和多样性可能会显得陌生,使人很容易在数字海啸面前晕头转向。
所以,坚守扎实分析的基本原则总是至关重要。还要记住,数字可能会告诉你一些以前根本都不知道要问的事情,但数字从来不会自己说话。文章来自:CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19