
大数据带给企业的风险_数据分析师
“大数据”。这是最新的IT流行语,而原因也不难理解。更快、更深入地解析更多信息的能力,使企业、政府、研究机构等能够以一种以前只能想象的方式去理解这个世界。
这些都是事实。不过呢……
还有一种情况同样也是事实:在争先恐后拥抱大数据的各种可能性之际,我们或许忽略了大数据带来的挑战,比如企业怎样解读信息,怎样管理数据带来的政治问题,以及怎样寻找必需的人才来理解新信息的洪流。
也就是说,大数据为数据分析的游戏增添了更大额的赌注。侵犯隐私的可能性增加,在快速变幻的市场中的财务敞口加大,把噪音当真知灼见的可能性增加,把大量金钱和时间用于界定不清晰的问题或机会的风险加大。
如果不明白、不化解这些挑战,我们就会面临这类风险:将本来有望强化组织的一切数据变成一种牵扯精力的东西,一种幻象,或者是一场伤筋动骨的权力争夺。
请允许我更具体地说说这些挑战。
找到有能力使用Hive、Pig、Cassandra、MongoDB或Hadoop等数据分析工具的人才只是整个洋葱的第一层。没有几家公司的内部专家能够从业务角度证明花钱聘请大数据专家的价值,更不用说对求职者的优劣展开评估。很多管理人员也缺乏基本的数学能力,所以如何找到能够掌握更复杂统计机制的决策者,也有可能是一种挑战。
让事情更加复杂的是,大数据工具还没有做好大范围推广的准备:它们仍在快速演化,大多数高校都没有教,供应商的支持不够理想,对用户灵活性的要求也高于更成熟的工具。考虑到这种情况,寻找合适人才的重要性只增不减。
洋葱的另一层:要让大数据发挥作用,程序员和分析师还要了解所涉行业的基本情况。比如说,一家制药企业的数据分析师注意到,近乎实时的销售终端数据显示1月份阿司匹林销量大增,于是他们说,流感愈演愈烈。但在调动销售资源开展大规模广告活动并增加产量之前,不妨把当前的销售型态与过去几年的情况做个比较。阿司匹林销量增加也可能是很多人在参加新年前夜的聚会之后出现了宿醉反应。如果分析师不了解业务以及应该问的问题,那么公司就有可能在花了很多钱之后一次次地走进死胡同。
最后一层是IT安全。如果说很多公司真的没有能力使用大数据工具,那么它们肯定也没有能力保障数据安全。收集到的信息越多,可能遭到泄露或窃取的信息也就越多。
人们常常认为掌握信息就会在组织内部掌握权力。显然,不管是谁来决定大数据时代该衡量哪些东西,这个决定者都会积累越来越大的权力。
另外,跨越组织边界的信息分享是大数据的属性之一,它可以颠覆传统的权力关系。
以一家在加拿大和美国各有一座工厂的公司为例。来自传感器的数据流显示加拿大工厂出产的发动机拥有97%的可靠性,美国工厂发动性的可靠性只有80%。突然之间,加拿大工厂管理人员在组织内部的地位可能就会升高,让美国工厂的管理人员感到惊慌。
公司的效益可能会得到改善,但高管必须做好管理内部政治的准备。
再举一个例子。大数据使人有机会衡量先前无法衡量的东西。如果一家大型零售企业现在可以更快速、更方便地衡量消费者对不同营销活动(不管是“超级碗”广告、杂志优惠券还是报纸广告)的反应,不同的利益相关者在组织内部的相对地位可能就会发生变化。他们也有可能对社交媒体团队产生憎恨,因为后者会用点击率数据来证明他们有能力或没有能力拉动销售收入。
原先要用几个月时间来规划、执行的流程现在可能只需几分钟就能评估完毕,将会进一步加剧上述颠覆过程。多年习惯了评估年度销售业绩的人常常很难应付每周甚至是每天的收入数据。按老一套办法管理的人可能会发现自己已经落伍于新的世界。
一旦知道信息即权力,有人可能就会投机取巧,损害公司的利益。
比如说,一家大公司开始以公司被推特(Twitter)提及的次数为指标来跟踪网站流量,跟踪结果在高管的推特活动一览表(dashboard)上持续更新。
一支销售团队的经理原先主要是通过贸易展会来获取线索并最终达成销售,然而当推特提及次数成为关键衡量指标之后,这位经理改变了部门的重点,宣称“我们要拿下dashboard”。到头来这个部门可能确实是拿下了dashboard,但这样一来,它强调的就不是曾经大获成功的展会,而是没有优质线索、无利可图的网站点击量和社交媒体流量。
普通数据库大约已经存在了35年的时间,所以人们有了很多经验,这些工具的理解和运用相对容易。相比之下,大数据还在萌芽阶段,所以组织、理解其深层意义的技术仍然处在起步阶段。
另外,理解如此大规模的信息也不是一件容易的事情。安全大师布鲁斯·施奇纳(Bruce Schneier)如此总结很多人的数学能力:“一个,两个,三个,很多个。”电子表格仍然是很多公司的主要定量分析工具,但它远远不足以用来实时衡量某个城市特定时刻道路上的汽车数量,或者是本周联邦政府在交通项目上的支出。
视觉化对于这类数据可以起到极大的帮助作用,但这个领域仍不成熟,其特殊语言也没有多少人懂得。
在如此大的规模层面上思考问题意味着什么?我们怎样才能学会针对主城道路上每一辆汽车、大型连锁零售店每一位顾客的智能手机、或配送车上每一个隔夜包裹所发出的信息提出问题?怎样才能让更多的商人学会按统计概率而非偶然事件思考?由于《点球成金》(Moneyball)这本书及同名电影的缘故,其中涉及的方法已经为球迷所熟知。但他们也将记得,这样的方法是怎样给一个组织带来了天翻地覆的变化,并被竞争对手模仿。
从某些意义上讲,它要求人们用一种全新的方式打量这个世界。
但优秀管理的原则也适用于大数据领域。在企业能够利用大数据获利之前,管理人员必须拒绝迷失在噪音当中,放任它掩盖客户、价值和执行这些基本力量。大数据的数量、速度和多样性可能会显得陌生,使人很容易在数字海啸面前晕头转向。
所以,坚守扎实分析的基本原则总是至关重要。还要记住,数字可能会告诉你一些以前根本都不知道要问的事情,但数字从来不会自己说话。文章来自:CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-24解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-24CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-24从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-23用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-23鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-23解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-21在AI渗透率超85%的2025年,企业生存之战就是数据之战,CDA认证已成为决定企业存续的生死线!据麦肯锡全球研究院数据显示,AI驱 ...
2025-07-2035岁焦虑像一把高悬的利刃,裁员潮、晋升无望、技能过时……当职场中年危机与数字化浪潮正面交锋,你是否发现: 简历投了10 ...
2025-07-20CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18刚入职场或是在职场正面临岗位替代、技能更新、人机协作等焦虑的打工人,想要找到一条破解职场焦虑和升职瓶颈的系统化学习提升 ...
2025-07-182025被称为“AI元年”,而AI,与数据密不可分。网易公司创始人丁磊在《AI思维:从数据中创造价值的炼金术 ...
2025-07-18CDA 数据分析师:数据时代的价值挖掘者 在大数据席卷全球的今天,数据已成为企业核心竞争力的重要组成部分。从海量数据中提取有 ...
2025-07-18