
如果你也想当数据分析师
时下最热的莫过于大数据,这三个从诞生起,就有太多的光环套在脑袋上。随之而来的就是数据挖掘师,数据分析师,数据科学家……
如果你也想当数据分析师,那么你也许该看看下面的内容:
1.数据是有立场的,立场决定解读
数据对于业务来讲,是KPI的衡量标杆,也是行动指南。但一旦涉及到立场和方向性的东西,必然有利益触发点的问题。比如同样的一次活动的网站转化率是1.2%,是好还是坏?这是做数据分析的第一步,要进行的定位,也就是我们所说的下结论。
好坏的区分在于比较,如何比较呢?我们知道比较分析方法有环比、占比、定基比、横向比、纵向比等,其中如环比可以比较昨日、上周今日、上月今日等,不同的时间对比出的结果一定有差异,甚至是迥然不同的结果。
那面对这种情况,除了分析师的经验以外,在都符合统计学规律的前提下该如何判断活动效果好坏?
第一步结果总算出来了。
那么,假设结果是好的(先不管对比的是什么时间),确实是好的吗?我们知道做活动效果肯定会好啊。尤其在中国,只要价格低,无论多么差的用户体验,无论网站UI多么垃圾,无论送货多么慢,订单转化率一定会起来。这就意味着,无论你的营销、运营做的怎么样(只要不是特别特别差),各个渠道、各个节点转化率都会上来。这时候,你会怎样分析?其中有多少是归于渠道或运营本身的优化因素,而有多少是归于活动影响?
假设我们能找出其中归于活动本身或渠道、运营本身的影响因素,结果出来后可能是:刨去活动影响,渠道、运营做的转化率其实变化不大(事实上通常是这样的,但是我们不能否认他们的功劳,毕竟没有流量、没有运营,网站无法正常运行),工作效果不明显啊?你会怎样?直接告诉你的同事,他们的工作没效果?可能你不会那样做,那此时你该如何取舍?尽职尽责做好一个数据的本职工作还是考虑下其他因素?怎么做才能既让数据价值最大化又能不打击同事的工作积极性?
2.数据质量永远是数据分析立项后首先要考虑的
做过大型数据分析的同学刚开始或多或少有这样的经历,拿到数据后经过分析发现了一个异常分析点,做了N多预处理、N多牛叉的模型,N多分析和多维钻取,最后把报告呈现出来,跟业务沟通的时候,业务只说了一句话“哦,那个异常数据啊,那是我们的测试数据”,然后我们会不会疯掉?
为什么会出现这种问题,因为拿到数据后没有进行一步必要的步骤——数据质量验证。什么是数据质量验证?我理解的是首先要理解数据来源、数据统计和收集逻辑、数据入库处理逻辑;其次是理解数据在数据仓库中是如何存放的,字段类型、小数点位数、取值范围,规则约束如何定义的;第三是明确数据的取数逻辑,尤其是从数据仓库中如何用SQL取数的,其中特别是对数据有没有经过转换和重新定义;第四是拿到数据后必须要有数据审查的过程,包括数据有效性验证、取值范围、空值和异常值处理等。
当这些工作都做充足之后才是数据分析。但可惜的是大多数数据分析师都不关注数据质量问题,甚至对数据的理解仅限于表现定义。当然做足了底层的工作,你会发现做起数据来事半功倍,并且你的结论和推到是经得起验证和考究的。
3.缺乏落地的数据没价值,除非是市场分析
数据的价格在于对业务的驱动,不管你的业务对象是你的BOSS还是同事。
很多情况下,我们的数据分析师是这样工作的:一天到晚闷头做事,出数据写报告。结果出来的数据结论和建议会有这么几种情况:分析过程明显不符合业务操作实际;结论明显是错的;建议方向性很对,但是空洞,具体执行缺乏落地点;建议方向性很明确,也有具体执行建议,但是业务不能执行;上面的问题中,第一二条会偶尔发生,第三四条会经常发生。为什么?从数据的角度来讲没问题,但是落实到业务实际上有问题。问题出现哪?主要是这几方面:
① 数据分析师根本不懂业务操作流程,凭自己的理解去猜测业务流程;
② 数据分析师根本不知道现在业务的困难点在哪里,哪些是目前最紧急的,凭自己的感觉,认为“我觉得这些对他们最最有用”;
③ 数据分析师根本不知道业务能控制哪些,不能控制哪些,即使能控制又是否业务有必要去做,导致建议不是该业务部门能执行的。
4.数据解读能力和业务应用能力永远大于工具应用能力,不要迷信算法和模型
受至于数据的普遍理论影响,很多数据分析师会认为会多少个模型,多少种算法是一件多么牛叉的事情,诚然,数据尤其在面对海量数据时,普通的数据分析方法常常感觉无能为力,但这并不意味着工具和方法就决定了数据分析师的层次。
举例来说,通常我们用的数据挖掘模型,业务都很难理解,假如你花了很长时间作出一个关联模型,如果你这样告诉你的业务受众:A商品和B商品关联程度较高,从支持度,置信度和提升度来讲效果显著。那我们可以预想到这个挖掘的结果很难落地,并且意义不大。
从业务受众实际应用层面来讲,两个商品的关联度高意味着什么,意味着用户通常会一起购买这两件商品(也有可能是复购,具体看数据选取规则),那一起购买又怎样?我们是否可以把这两件商品做打包促销?是否可以做关联推荐?是否可以做个性化营销?是否可以引导用户消费的倾向?甚至在活动页面设计上,是否可以将相关度高的品类,品牌摆放在一起来促进销售?又或者这是否可以做流失挽回的参照指标,重新审视之前每次的广告“通发”?这才是数据价值,无法跟业务结合的数据模型毫无价值。
5.业务需求是数据分析的起点,但之前你需要培养业务的数据意识
很多时候我们希望等待我们的业务自己上门提需求,并且以需求为数据分析的起点,似乎很多教材也是这么说的,基于业务需求的数据分析目的更明确,分析结论和效果落地也会阻力更小,但实际情况是业务通常是数据不敏感的,主要表现在:
业务没有数据决策的意识。
大多数业务的第一行动引导因素还是业务经验,无论是基于事实的经验还是拍脑袋决策,数据绝对不是行动前必须参考的因素;业务不知道数据在哪些方面能帮到他。
业务很多时候只是有个想法,想让数据证明点什么,但说不清楚。通常业务的措辞是“我们想知道这次活动的效果怎么样”、“我们想了解广告效果为什么不好”。至于具体效果指的是什么业务自己也说不清楚,甚至是业务自己也不知道到底想要什么。业务不相信数据。
如果数据结果出来时和业务设想的不同,那业务的第一反应是怀疑数据,无论是数据的出处、分析过程还是结论,业务总想找到能证明自己观点对的东西。所以我们会感觉,业务用数据的目的只是为了证明自己当初设想的正确性。
作为数据分析师,我们不能要求业务必须要懂数据、理解数据,但是我们需要把数据能解决什么问题,怎么解决的,解决之后会给业务带来哪些改进以及效果上的优化,如果能预测出一个具体数值或最起码有一个范围,业务会更加相信数据的真实性、准确性。如果培养业务的数据意识?
数据意识是一个不断积累的过程,需要每周至少 2~3次专项沟通,每次沟通至少持续半个小时,大概半年之后业务会形成一定的数据意识,最起码意识到在某些时候,数据会解决一些问题;每次沟通时,明确告诉业务数据能给他们带来哪些好处,能实现什么,在哪些主要业务点上能发挥作用,这样业务会认为数据会是一个能帮到自己的东西;数据不只是在业务执行之后才会发生作用的,在业务执行前的预测与计划,在业务执行过程中及时预警与恶意数据监控都是数据能发挥作用的场合,并且这些都能在“坏数据”、“坏结果”出来之前通过数据区去改善,这些将比结果出来后再去分析要更有意义。
作为数据分析师,需要不断提高自身能力。能力包括业务理解能力和数据分析能力,既能把业务“粗糙的要求”转换成数据需求,又能将数据结果转化成业务可理解、可执行、有时间限制、能验证结果的数据输出。
数据是一门艺术,良好的数据能力可以处处在业务中展现能力,并且确实可以提高业务价值,这是数据存在根本,也是数据分析师立足的根本。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-08-07SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-07大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-07解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-07CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-07通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-07评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-07CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-07反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-07MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-07抖音数据分析师:驱动平台增长的幕后推手 在抖音这个日活用户数以亿计的超级平台上,每一次用户的滑动、点赞、评论,每一条 ...
2025-08-07基于 SPSS 的中介效应分析结果解读:揭示变量间的隐性关联 在社会科学与自然科学研究中,变量之间的关系往往并非简单的直接作用 ...
2025-08-07