京公网安备 11010802034615号
经营许可证编号:京B2-20210330
菜鸟也有当家时。作为出炉不久的“数据分析师”,今天被一个朋友问了三个问题,当时比较简单的回答了下,过后想起来,其实这三个问题正是可以用来反思和总结自己的好机会,于是有了这篇日志。
这三个问题是: 1、数据分析的工作当中主要做哪些实质性的工作 2、分析人员比较重要的个人素质 3、用excel进行分析的常用功能有哪些
一、数据分析中有哪些实质性的工作
其实,数据分析从头到尾都是实质性工作。 希望成为数据分析师的人,其实可以轻易的从书籍中或者网络上找到很多方向性的东西,例如数据分析的原则、数据报告的内容构架方法、数据分析产品的形式等等。但实际上,扎进一个行业,深入了解它内部的数据逻辑、管理原则、传播形式,并为此需要准备的数据分析工具和常用方法,才是最重要也是最花时间的,甚至,如果不做这些,“数据分析”这个概念就是一个空谈。 “实质性”的工作可以分为三个主要的板块: 第一,对行业的数据逻辑及数据获取方式的了解。数据从哪儿来的、怎么来的、都包括哪些维度、用什么方式进行采集和统计的、如何标记、如何去重、有什么可能出现误差的地方、误差如何解决……这些全部需要一清二楚。未必要分析师去洞悉程序的逻辑,但必须清楚数据信息的来龙去脉,以及与企业产品的关系,数据的可扩展性,等等。
了解了这些,才能够在进行分析的时候更有效的运用数据。 这其中,对误差的认知和期望极为重要。这不但能够帮助分析师在数据使用时减少错误,更重要的是,当一些数据无法直接得到,或一些观点的逻辑无法直接通过现有数据得出的时候(可能这是相当普遍的状况),分析师能够知道如何设计数据获取方法和分析方法来有效的得到结论而不出错。
第二,对工具的熟悉。
不同的数据量级和数据结构,使用的软件工具不尽相同。相同的工具,因为分析内容不同,常用的功能也不尽相同。要依据自己工作的需求来使用和学习。——听起来是废话是吧。对的,就是这样,因为这是很个性化的事。最好的做法就是确定软件工具后找本书,啃,努力啃,花时间啃。然后向前请教设计师,向后请教数据挖掘专家,上游下游的工具都接触一些,不会错。 第三,对出口的理解。数据分析是为了什么,这直接决定数据分析的策略和逻辑。用于产品传播、用于向上级汇报、用于总结工作、用于研究竞品、用于PR造势、用于媒体报道……虽然是同样的基础数据,但关注点和分析方法截然不同。分析师要在工作中慢慢理解每一个出口对数据的需求,这将指引咱们做出最有用的分析。
这里再插进《深入浅出数据分析》里的一句话:“作为数据分析师,如果只做了数据传递的工作——没出息。”要有观点。再说一遍,要,有,观,点。 上述三点都是要动脑子花时间磨的,和切实的工作内容非常相关,因此,它们一旦落于纸面(长微博?)也成了空谈了……所以,憧憬昏析师的亲们,这种问题听两句就够啦,谁说的也别太信。去做才是王道! 二、重要的个人素质 也是三点:好奇心、想象力、耐性。 好奇心就是要问为什么呗。数据突然高了为什么,出现无法识别的数据为什么,为什么会出错……不把任何数据的变化(或者不变)当“正常”。——嗯,做个敏感又神经兮兮的昏析师吧,这个世界需要你,少年。 想象力——我觉得这个是最难的,因为这个想象力不是天马行空的那种,而是了解了行业运营和管理规则之后(不了解?看行业报告吧,看竞争对手吧,看先进经验吧,看招股说明书看上市公司季报吧,度娘去吧,知乎去吧……),还能跳出框架来进行观察的能力。统计学中那些概念,手边备本书谁都能说出一二,但怎么用概率去描绘用户行为,怎么用同比环比来测算行业变化,怎么用标准化的方法来衡量产品的竞争力……分析师必须想出新奇的玩法来。真的好难。但一旦突破一点就是大进步,得坚持啊…… 耐性。不用说了吧,耐性就是,就算要吐了,还是要回去最后确认一眼是否没问题了。强迫症的同学可能比较有优势吧~哈哈。不强迫症的,就咬碎银牙(什么 ……
三、Excel的常用功能 排序、筛选和简单的计算都不用说了。
此外个人来讲数据透视表最最常用,其次是一些查询和匹配的函数。Excel是超级强大的工具,要相信,每个数据处理的需求,Excel基本都有比你会的那种更快捷的处理方案,如果不是一样快捷的话。这个会是长期功课…… 所以这就是简单的总结啦。要做靠谱的昏析师嗯!
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22