01、学习的动力

我在某互联网电商平台任职运营岗，在数据分析板块属于小白，虽有一定EXCEL的基础，但与平时工作中接触的用户行为数据、产品数据分析来讲，这点完全不够用，因此不得不提升自己的数据分析技能，于是一开始就在网上搜索自学，逐渐了解了大数据、数据库、机器学习这些专用名词，特别是被数字化转型影响，感觉这个时代如果不具备点数据思维和技能，就很快会被AI替代了。

另一方面，自己是业务出身，毕竟数据分析也是为业务服务，所以业务经验+专业技能，这样的发展来对我来讲更靠谱，所以下定决心学习，逼自己一把。

02、备考过程

我是在19年开始自学数据分析，下定决心后，就以考取CDA认证作为最终目标（毕竟老牌认证）。

正式备考是从2020年开始，平均每天学习2小时左右，主要以看书（10本）、刷题（官方2000题）和辅导视频（官网课程）为主，到现在快两年了，痛并坚持着，坚持并难受着，但最终还好，LEVEL I 和 LEVEL II 都拿到了A的成绩，也算是享受到了一种来自内啡肽的快乐。

目前正在继续备战LEVEL III，希望能两年圆梦，噩梦结束，美梦成真！

03、备考经验

CDA LEVEL I

首先说下LEVEL I：

我大概备考了三个月时间，在备考前，我首先是找官方考试大纲，通过整体把握了解各个模块的大概内容、关系和学习路径，做到心中有一个whole picture，这是LEVEL I的考试大纲：

整体来讲，LEVEL I 就是入门概念+基础技能+可视化，以业务描述性分析为目标，分为上图七个章节，大纲的安排是首先让考生先了解数据分析基本概念、方法和职业，然后以分析过程为路径，先了解什么是数据，数据应该怎么获取，获取后有哪些分析方法，如何将这些方法与业务结合，最后得出可视化的分析结果，思路清晰，学习可以有的放矢。对我来讲（非技术出身），最难的应该属于SQL数据库，毕竟有代码部分，但真正学起来上手还是较容易的，并且可以安慰的是考试不会考编程。

LEVEL I 备考中，

Part 1 概述，Part 2 数据结构两部分，内容偏简单，我没有专门看什么书，主要是对考纲中的名词和概念进行了简单记忆，结合视频和刷题就足够了。
Part 3 数据库部分是我重点学习的部分，这块我推荐《SQL入门经典》这本书，结合Mysql多加练习，基本一个月时间就可以掌握了。
Part 4 描述性统计分析部分，整体非常简单，因为大学学过统计学，基本内容温习下即可掌握，稍微难一点的属于分布和相关分析部分，但是实际题目中比例较低，也不会有公式推导这样的变态题目，有一些计算题。这块内容我准备了两周左右。
Part 5 和 Part 7 部分实际就是EXCEL的活用和延展，首先要掌握EXCEL基础的一些技能（不用学很多函数，考试不会考），然后结合Power BI工具，动手操作起来，最好能做一些老师推荐的案例。因为我在工作中经常会做一些简单的图表和数据透视分析，于是在工作中就把学的内容进行应用、探索和验证。
重点说下Part 6 部分，内容感觉很实用但是考试来讲又有点虚，因为这块内容的有些概念是比较超前的，是需要在业务中长时间积累的，简单来讲就是电商领域经常说的“人货场、进销存、漏斗”等。由于此部分内容目前还没有专门的教材可供学习，所以我重点还是以辅导视频为主，然后就大纲中规定的知识内容进行自主搜索、拓展学习，并在刷题中总结出这类题目的大体规律。

基本可框定两个范围:

业务各环节的相关指标学习（流量相关指标、转化相关指标、营运、销售相关指标、库存类指标、常用财务指标、绩效类指标、客户相关指标）；
大纲业务分析方法模块中涉及的方法概念和相关案例（客户分析，商品分析，流量、转化分析，行为效果分析，业务分析模型，业务分析方法）。

LEVEL I 官方的推荐书籍都是选读，这是官方推荐目录：

结合我自身的经验推荐大家必读的有《SQL入门经典》和《统计学》两本就足够了。

CDA LEVEL II

其次说下LEVEL II：

LEVEL I 拿到A后信心满满，短暂休息了一个月，就开始了LEVEL II 的备考。
因为LEVEL II 涉及的教材和学习资料较多，并且还学习了Python，所以LEVEL II 备考我准备了大概4-5个月时间。

以下是LEVEL II 的考纲：

整体来讲，LEVEL II 为数据分析的进阶内容。以专业数据分析流程，分为了6个部分，数据的采集与处理，采集后对数据进行规范化储存管理，接着根据业务的需求进行标签体系的设计，对标签数据进行统计分析、建模，最终数字化工作方法部分为目前比较火热的数字化转型内容，侧重与业务分析流程。LEVEL II 中重难点部分在于统计分析与数据分析模型两部分，这两块设计的专业知识多，要求高的话会用到python进行分析，但值得庆幸的是，LEVEL II 也不考编程操作。

Part 1数据的采集与处理部分中，关于市场调研、问卷等都属于简单基础的内容，重点在掌握一些数据处理的方法，基本任意一本数据分析书籍中都会有这个部分的讲解。
Part 2数据模型管理内容，可以参考DAMA数据管理知识体系指南这本书，找到相应的知识点进行复习，基本也是理论的内容为主。
Part 3标签体系和用户画像，这部分的内容也是以业务积累为主，目前很难找到对应的专业教材，加上考试的比例较低，看辅导视频加模拟题学习就可以了。
Part 4统计分析部分偏理论内容，可以延续LEVEL I 的《统计学》教材进行对应学习，将每个概念理解透彻，掌握大纲中关于“应用”部分的要求，不用纠结公式推导部分，考试中会涉及一些计算题，只要能够掌握一些常用的重要计算公式即可。
Part 5数据分析模型部分是为以Part 4为理论基础，进行数据的建模分析，这块内容专业性高，可以参考《统计分析：从小数据到大数据》，《Python数据科学》两本书，学习过程中尽量能用相应的分析工具进行操作练习，加深理解记忆，如果不想编程的小伙伴可以用SPSS进行，但作为一名互联网分析师，Python肯定是必备的技能之一。
Part 6数字化工作方法是偏管理层面的企业数字化转型内容，侧重点在根原因分析，可以学习《根原因分析-简化的工具和技术》这本书，且重点看老师对这块内容的讲解。

关于LEVEL II 的一些必读选读书籍，官方已经推荐出来，个人建议根据官方的要求学习即可，LEVEL II 主要就是在于花时间，除了啃书看视频，还得实操起来，方能拿到一个理想的成绩。

CDA LEVEL III

最后简单说下LEVEL III ，因为还在备考中，所以对于LEVEL III 的经验分享也只能是一个简单的开头，通过跟其他考生的咨询交流，也有一些重点学习方法。

整体来讲，LEVEL III 在于高级数据分析、数据挖掘、机器学习。

内容涵盖高级分析师的各项基础及进阶的知识点。基础的部分包括数据挖掘基础、高级数据预处理以及机器学习算法。进阶的部分则包括高级特征工程技术、自然语言处理与文本分析及深度学习。在机器学习实战上,涵盖当今较火的几个主题，包括自动机器学习、类别不平衡问题的处理模式、半监督式学习以及模型优化的方法。

LEVEL III 的复习大家推荐的是两本重点教材，《数据挖掘导论》和《数据挖掘：概念与技术》；其次还包括官方必读的几本《机器学习》、《精通特征工程》、《文本分析》等，如下图：

其次就是对模拟题中的案例操作题进行反复的练习，最好能用Python，之前有考生也用的SPSS Modeler这个工具，因为听说案例操作题是历年考过的真题，并且模板和套路都类似，只是需要用的算法可能会不太一样。在此也强烈种草李御玺老师讲的辅导视频课，幽默风趣，深入浅出，对我来讲学习起来很快乐！关于LEVEL III 的一些详细备考方法，得靠通过的大神们分享了。