京公网安备 11010802034615号
经营许可证编号:京B2-20210330
上周从买了两本书《谁说菜鸟不会数据分析》和《大数据时代》,学习过程中想把书本内容通过总结、理解、实践、内化掌握来变成自己的东西,把握好学习的节奏,坚持就好。
初级阶段我更多的是来转述前辈们总结出的东西,但自己若有实践中的体会也会写入其中(自己的体会粗体标出)。本来就是记录菜鸟成长过程,所以内容对行家来说太小儿科,对新手入门来说或许会有些帮助。
以下开始是对《谁说菜鸟不会分析数据》一书的学习总结,第一章:数据分析那些事儿。
1.何谓数据分析?
用适当的统计分析方法对收集来的大量数据进行详细研究和概括总结,以求最大化地发挥数据的作用,提取有用信息和形成结论,这一过程叫做数据分析。
2.数据分析的三大作用:现状分析、原因分析、预测分析。
1.明确分析思路:
首先要明确分析目的:菜鸟与数据分析师的区别就在于菜鸟做分析时目的不明确,从而导致分析过程非常盲目。这点有比较深的体会,在公司里做过关于搜索和新手的产品数据分析,自己对分析目的没考虑太多,靠的是前人留下的上期数据分析结果,倘若让我从零开始做,估计会很盲目。
然后确定分析思路:梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。
最后还要确保分析框架的体系化,使分析结果具有说服力:营销方面的理论模型有4P、用户使用行为、STP理论、SWOT等;管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART等。在上周一个汇报上使用了SWOT分析方法,对这些营销或管理的模型还都很陌生。
2.数据收集:
一般数据来源于以下几种方式:数据库、公开出版物(统计年鉴或报告)、互联网、市场调查。
3.数据处理:
数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。导师提过在做数据处理时,不要在原始数据上进行数据处理以防原始数据丢失,保留数据处理过程以便发现错误时查找。
4.数据分析:
数据分析是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
与数据挖掘的关系是数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
5.数据展现:
一般情况下,数据是通过表格和图形的方式来呈现的。常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等。进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。
在一般情况下,能用图说明问题的就不用表格,能用表说明问题的就不用文字。
6.报告撰写:
一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
另外,数据分析报告需要有明确的结论,没有明确结论的分析称不上分析,好的分析报告一定要有建议或解决方案。
1.分析目的不明确,为分析而分析。
2.缺乏业务知识,分析结果偏离实际:数据分析师的任务不是单纯做数学题,数据分析师还必须懂营销,懂管理,更要懂策略。上周五听了公司专门做数据分析的同事做的关于新手留存的数据分析专题,他们数理统计专业知识必然过硬,而且对业务比较熟悉,能通过数据结合不同业务做出相应结论,还能为不同业务提出改进意见,不熟悉业务不懂策略怎行?
3.一味追求使用高级分析方法,热衷研究模型。
1.数据分析的广阔前景:根据美国劳工部预测,到2018年,数据分析师的需求量将增长20%。就算你不是数据分析师,但数据分析技能也是未来必不可少的工作技能之一。
2.数据分析师的职业要求:懂业务,懂管理,懂分析,懂工具,还要懂设计。
其中,懂分析中,基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等;高级的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。
懂工具中,常用的数据分析工具有Excel、Access、SPSS、SAS,先学会用Excel,它能解决80%甚至100%的问题。
懂设计中,图表的设计是大学问,如图形的选择、版式的设计、颜色的搭配等,都需要掌握一定的设计原则。
以下几个常见的只是提一下:平均数、绝对数和相对数、百分比和百分点、频数和频率、比例和比率。
另外倍数与番数、同比与环比,我之前有疑问的特别提下。番数是指原来数量的2的N次方倍,比如翻一番为原来数量的2倍(2的一次方),翻两番为4倍(2的二次方)。同比是与历史同时期进行比较得到的数值,环比是指与前一个统计期进行比较得到的数值。(文章来源:CDA数据分析师培训官网)
这部分主要是对数据分析有了一个全面的了解而又粗略的认识,说实话这样的总结复述后很多地方我印象也不深,但总比看过一遍后不再管能多记住一些,当然能实践才会印象更深。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11在CDA(Certified Data Analyst)数据分析师的实操体系中,统计基本概念是不可或缺的核心根基,更是连接原始数据与业务洞察的关 ...
2026-02-11在数字经济飞速发展的今天,数据已成为核心生产要素,渗透到企业运营、民生服务、科技研发等各个领域。从个人手机里的浏览记录、 ...
2026-02-10在数据分析、实验研究中,我们经常会遇到小样本配对数据的差异检验场景——比如同一组受试者用药前后的指标对比、配对分组的两组 ...
2026-02-10在结构化数据分析领域,透视分析(Pivot Analysis)是CDA(Certified Data Analyst)数据分析师最常用、最高效的核心实操方法之 ...
2026-02-10在SQL数据库实操中,字段类型的合理设置是保证数据运算、统计准确性的基础。日常开发或数据分析时,我们常会遇到这样的问题:数 ...
2026-02-09在日常办公数据分析中,Excel数据透视表是最常用的高效工具之一——它能快速对海量数据进行分类汇总、分组统计,将杂乱无章的数 ...
2026-02-09表结构数据作为结构化数据的核心载体,其“获取-加工-使用”全流程,是CDA(Certified Data Analyst)数据分析师开展专业工作的 ...
2026-02-09在互联网产品运营、用户增长的实战场景中,很多从业者都会陷入一个误区:盲目投入资源做推广、拉新,却忽视了“拉新后的用户激活 ...
2026-02-06在机器学习建模过程中,特征选择是决定模型性能的关键环节——面对动辄几十、上百个特征的数据(如用户画像的几十项维度、企业经 ...
2026-02-06在CDA(Certified Data Analyst)数据分析师的日常实操中,表格结构数据是贯穿全流程的核心载体,而对表格数据类型的精准识别、 ...
2026-02-06在日常办公数据分析中,我们经常会面对杂乱无章的批量数据——比如员工月度绩效、产品销售数据、客户消费金额、月度运营指标等。 ...
2026-02-05