做数据分析时,应关注哪几个问题
1.你想解决的是什么问题?
对于数据分析师或数据工程师或者其它相关人员,找到一些新的应用或者好玩的东西实在太容易了,问题是这些东西是否与业务相关。鼓励他们去关注现实存在的问题,实现小的创新和改进,一次只做一件事,等时间长了,信任增加,就可以减少对他们的管控,前提是你能分清探索 “新路径”和原地打转之间的区别。
2.你真的明白这些数据意味着什么吗?
人们经常在不太理解数据背景的情况下就开始收集,从一开始的时候就有误解,等发现时已经太晚了。所有的数据,无论量有多大,都是非常精微的事物。NASA曾有一架火星登陆器坠毁,就是因为其中的一个团队使用英国力矩计量单位“英尺*英磅”,而其它团队使用“牛顿”为单位,这类区分会使得数据看起来大不相同,尤其是通过不同的社交媒体平台或者自动分析系统收集来的数据,会有这样的问题。
3.我们应该信任数据吗?
靠不住、不准确的数据非常多。坏零件组装不出好汽车,同时,错误的数据再怎么分析也得不到正确结果。有些数据天生就不准确,比如 GDP预测一类,另一类数据则是在流程中失掉了精确性,有时候数据收集就是一个不断出错的过程,看看银行错误百出的信用评级报告就知道了。除非有一套非常好的系统流程来保证质量,否则就要假定得到的数据并不准确。
4.有没有一些重要因素,诸如隐性的判断、先入为主的前提或者自相冲突的数据结果使你对数据的认识发生偏差?
这种情况很常见。首先,我们都希望能从数据分析中获得回报,这就产生了一种效应,即人们总会看见他想要看见的东西。比如说,你期望看到10%的收入提升,你手下的人就会找到短期内增长10%的证据,但是过分关注眼下的10%,可能会失掉从数据中发现未来 100%增长的机会,或者干脆看不到负面趋势的警示。
其次,先进的数据分析需要超强的判断力。数据专家倾向于只看数据而忽视其它因素,你得保证这种事不要发生。你越重视他们的工作结果,他们提供给你的数据就越清晰完整。
第三,分析的意义在于更深入地了解世界运行的方式。错误的假设和前提非常有害。举例来说,金融危机的一个重要原因就是大家都先入为主地认为房产价格与股市无关,结果成了悲剧。
5.你的结论是不是建立在对市场的全面理解、对条件变化的认识以及对最坏情况的心理准备的前提之下?
不要将数据分析看成传统的物理或者数学研究,验证数据结果可不像伽利略从塔上丢下物体的那类古老实验,数据科学家必须是怀疑论者,不相信别人的结果,不断地检验、检验、再检验,他们要尽量全面地描述数据中可能存在的不确定性。这很重要,因为你的数据来源往往是超出数据科学家的控制之外的,他们不知道来龙去脉,因此需要明确地指出结论中的不确定在哪里,供管理者进行判断。
6.谁将会受到影响?方式如何?
数据的爆炸式增长使得人们的隐私成为大问题。无论在组织内部还是外部,在“有用”和
“侵犯隐私”之间仅有一线之隔,数据科学家的洞察力非常惊人,可是他们并不了解这些结果背后的意义和风险,这些问题应该由管理者而不是他们来解决。
小心一些,不要让业务与数据之间的联系过分敏感。你需要关注的其实只是纽约证券交易所的瞬间暴跌或者推特上的负面言论带来的业务下滑。
7.我能为此做些什么?
如果前六条都没解决,这个问题自然也不会出现。时刻想着重要的发现会对整个组织产生影响,我们都很关注变革管理,变革总是困难并且阻力重重的,光靠数据分析师无法实现,需要管理者的参与。
除了第一个和最末一个问题,其它的问题只要一提出来,管理者就会开始思考。不过有经验的数据分析师也会想到这些事,有说服力的答案能够帮助管理者和数据分析家们从大数据中发掘对业务有意义的内容。(文章来源于cda数据分析师)
数据分析咨询请扫描二维码
CDA数据分析师在中国航信高科技产业园进行了面向测试度量的数据分析培训课程,培训人数近2 ...
2024-05-01CDA数据分析师走进深圳迈瑞生物医疗电子股份有限公司,在迈瑞总部展开了为期两天的培训,本次课程参训人员线上及线下近百人, ...
2024-05-01CDA数据分析师在合肥市对合肥阳光新能源科技有限公司开展了为期8天的企业内训。 合肥阳光新能源科技 ...
2024-05-01CDA数据分析师走进海尔大学,进行了《数据治理与数据中台建设的道与术》专题培训,培训现场爆满,近百人参加了此次培训。 ...
2024-05-01在中国银行苏州分行培训中心开始数据分析师培训,此次培训课程共10天内容,包括Excel、MySQL、概率论与数理统计、SPSS等内容, ...
2024-05-01从实际的业务需求出发,结合行业的典型应用特点,围绕实际的商业问题,探讨数据挖掘、机器学习模型在金融领域的应用,包括获客、信用评分、细分画像、交叉销售、反欺诈、违规识别、时序预测、运筹优化、流程挖掘九个方面,形成 ...
2024-05-01本次培训课程为线上+线下的模式,由于学员编程能力不一、部分学员没有编程基础,故提供统计学、python基 ...
2024-05-01华夏银行信用卡中心-机器学习培训 1、课程亮点 取材于业界一流企业和顶级咨询公司的行业实践;已经被证明是人人 ...
2024-05-01主 题:数据中台建设及数据分析应用主题分享 1. 数据中台市场洞察 2. 主流数据中台产品比较 3. 某企业数据中 ...
2024-05-01围绕“数据驱动”战略,全力打造我行 300 人数字化人才梯队,着力培养数字化管理人才、大数据专业团队 ...
2024-05-01在当今数据驱动的商业环境中,数据分析成为了企业决策的重要依据。通过对大量数据的收集、处理和分析,企业能够更好地理解市场 ...
2024-04-29在人工智能(AI)的世界里,提示词(Prompt)是一种强大的工具,它能够引导AI按照用户的需求产生特定的输出。本文将深入探讨AI ...
2024-04-29CDA立足未来职场,拓展前沿视野——对外经贸大学保险学院举办“三全育人大讲堂”分享行业最新动态。 ...
2024-04-294月2日,CDA数据分析师创始发起人兼协会理事长赵坚毅博士受邀在浙江万里学院举办了一场以“数字化能力在职场中的作用” ...
2024-04-29随机森林(Random Forests)现在机器学习中比较火的一个算法,是一种基于Bagging的集成学习方法,能够很好地处理分类和回归的问 ...
2022-12-23方差分析是数据分析中常用的一种统计分析方法,接下来让我们简单了解一下方差分析的基本思想和原理吧。 方差分析(Analysis ...
2022-12-23来源:关于数据分析与可视化 关于streamlit-aggrid 数据排序 表格样式的调整 数据 ...
2022-08-03作者:麦叔 定义 「把上面晦涩的概念汇成一句话就是:」 ❝ 回调函数就是一个被作为参 ...
2022-08-03现今,高学历人群日益增多,物以稀为贵的高学历光环淡去。无论本科生还是研究生,甚至博士生,求职竞争力都大不如前,就业压力越来越大。
2022-06-01某家企业10个人面试,有9个本科生……如何脱颖而出,除得体的举止和良好的沟通力外,证书成重要筹码,这也是很多人考证的关键所在。
2022-04-14