
12月的CDA考试,看看状元们都说了些啥?
第三届CDA数据分析师认证考试,在刚刚过去的2015年12月月底悄悄落下帷幕。
热腾腾的成绩已经揭晓,崭新新的证书大抵都抵达每位通过考试的持证人手中啦!
CDA数据分析师旗下的“每天一个数据分析师”微信公众号,本期采访了可不止一位,他们有的是从业几年甚至十几年的老兵,有的是从零开始想要转型的准数据分析师。但他们不久前做了同一件事儿,那就是参加了第三届CDA数据分析师认证考试,并且名列前茅。
下面一起来看看我们状元们的风采吧!
Step 1 :小白也有春天
秦志龙
CDA Level 2 建模方向·状元
毕业于北大物理系,目前在一家研究所工作,虽然现在的日常工作与数据分析没有太大关系,但对数据分析有浓厚兴趣,准备转型做一名数据分析师。
备考建议
我的学习过程很简单,就是遵照我们的考试大纲列出的参考书都看了,比如说数据挖掘方面的推荐两本教材,工具选择了spss modeler,把推荐的教材对照着考试大纲的需求从头到尾学了一遍,把大纲上每个要求的点都弄透弄会,最后再复习下。我复习了将近两个月,平均每天坚持学习3-4个小时。
想好参加考试的目的是什么,是为了拿到一个证还是学能力,这两方面都很重要,除了考试本身和分数之外,要注重提升自己的真才实学,在准备的过程中不要仅以考试为目的;回到考试本身来讲,我们的考试更多的是对数据挖掘本身以及各种算法的认识,如果备考时间没有那么充足,建议同学们不要在算法细节上钻的太深。
我的计划
我选择CDA考试是为了增加一些求职的竞争力,大多数人走入工作岗位之后还是会有学习的需求,面对很多新事物,新的挑战,学习能力很重要。下一次准备考一考大数据方向。我现在只是掌握了一些理论和方法,但是在实践方面还很缺乏,这方面还要再加强,多找机会实践。
Step 2 :跨专业转型
苏振裕
CDA Level 2 建模方向·榜眼
最初学的是和金属有关的专业,和统计、计算机完全没有关系。后来接触到数学建模,随之对数据挖掘产生兴趣,目前在电信行业,成功转行。
备考建议
之前参加了CDA LEVEL 1的考试,之前看过一些spss,R语言统计分析的书,觉得如果不是要自己编写核心代码计算,应用层面都是不会太难。
除了平时看书,考前复习。CDA考试的很多题目都是上课的时候的例题,我觉得能把培训视频看两遍,跟着老师一步一步操作,就能把原理、软件操作搞定。我就是这么做的,理论结合实际,记忆效果更好。
如果想把数据挖掘学好,光看培训视频还是不够的,培训视频只是入门,还要看其他的书,案例。看书会存在很多疑惑,疑惑的原因我想还是在算法原理和使用范围方面吧,这些反过来可以加深对培训视频的理解和记忆。
很多参加CDA的同学都是在工作了的,平时上班很辛苦,要是每天能看半小时书也是不容易。说白了还是多看书多积累,工作之后更能理解知识是怎么用的,更有效果。
我的经历
我在大学学的是金属相关专业,后来在一个伪随机数研究项目中开始接触数学建模,用的是软件是MATLAB,兴趣使然,看了很多MATLAB的书,也看了一些数据建模的书。
决定转行业是在大四实习的时候,那时候在一个比较大的不锈钢厂的物理实验室管理一台电子显微镜,也了解了不锈钢厂的生产流程。不喜欢工业生产,下定决心转行。想想大学自己看过的书是MATLAB,spss,就投了很多简历,没有回应。后来找了一份数据库方面的工作,是电信行业的。当时领导说了一些数据分析的事情,然后开始看R语言,听说数据挖掘很火,也在看数据挖掘的书籍。当时真的是很紧啊,主要不是统计和计算机出身,对很多知识看起来都比较慢。
到目前为止,虽然对数据挖掘也算了解,也能用,但是核心的算法和计算方式就不太明白了。这就是商业应用和算法开发的区别。商业应用侧重在将算法应用在商业问题上,算法开发除了了解核心原理,还要懂得优化算法,改造算法。
目前在做电信的数据建模,就目前的感受是,数据挖掘的算法都是很简单的,重要的是商业理解,要对这个行业有积累。为什么项目的大部分时间都是画在数据清洗上?是因为数据的提取要确定各种口径,怎么取,数据出了问题要回溯。这些都是业务经验。在做分析的时候会发现很奇怪的结论,很难解释,其实是数据有问题,要重新核查口径。当没办法从数据中发现为什么异常,就应该从实际情况去看。
和数据较真,觉得技术很高大上,喜欢一切从数据出发,这就是刚从事数据分析人员容易犯的错误,要知道,技术最终还是服务商业的。
Step 3 :多读书,读好书
王清文
CDA Level 1 状元
CDA Level 第14期上海学员,在互联网行业做运营数据分析师三年有余,保持每天学习和阅读的习惯。
备考建议
1级考试有一些比较基础的理论知识,比如说概率密度函数,以前学过,现在有点模糊了,跟着老师又回顾了一遍,挺受用的。CDA的培训比较系统,懂一开始的统计基础到后来的SPSS、SAS,再到后来的实践。自学会比较零碎,CDA学下来知识结构比较清晰,用起来也比较得心应手。CDA第三本教材上数据挖掘的一些理论内容讲的比较细致。
我的学习
我一开始做运营数据分析,与业务比较相关,最近几年大数据确实很火,最近我自己也在学习数据挖掘,看了两本国外的书,一本是《模式识别与机器学习》,还有一本叫做《统计学习要素》,这两本是学习数据挖掘的基础读物。
就数据挖掘来说,可以读一些书,一个是《集体智慧编程》,里面介绍了一些简单的实现,比如推荐算法,还有搜索引擎的算法,用Python来写的,如果想要做数据挖掘的话可以做一些Python的书,这一本是我入门的第一本书。另外,在Coursera上有吴恩达的公开课,讲数据挖掘讲的比较清晰,有理论基础,深入浅出,也有一些实现,主要用Matlab。
学SAS的话,徐刚老师讲的很好,提供了一些教材。如果想做数据分析的话,SAS还是要学一下,它有一些现成的东西,不用写算法,比如描述性的数据分析、建模之类的,很方便。
Step 4:能用技术解决的问题都不是问题
樊海平
CDA Level 2 大数据方向 状元
10余年从业经验,最初从事计算机相关行业,目前偏爱研究数据挖掘。
我的忠告
学统计出身的人和我们学程序出身的人看大数据的角度是不一样的,在学习大数据的过程中可以两方面兼顾。如果统计的基础比较好,可以多接触一些程序的东西,程序员可以多学习数据挖掘的内容。
眼高手低,这可能是毕业生的通病,即便是理论基础很扎实,要解决好实际工作中遇到的问题还是需要更多实践经验,这个行业还是有很多坑的,要务实一点。
能用技术解决的问题都不是问题,更多的问题是人的问题,比如说沟通,每个人对一个问题的理解不一样,如何说服老板接受你的想法,把结果用最合适的方法介绍给领导和客户,让让他们信服。我们聘用的一些分析师就存在这样的情况,技术很好,但就是将不明白,表达能力不够。
Tips:
CDA数据分析师全国认证考试,一年由经管之家举办两次,分别在6月和12约最后一个周末进行。CDA数据分析师等级标准来源于经管之家与CDA协会成员长年从事数据分析教育与工作的经验和实践,对数据分析行业的研究,对数据分析教育的不断完善开发,从而总结出来的一套专业化,科学化,规范化,系统化的标准来认证什么样的人才才是合格的CDA数据分析师。最新考试信息请戳这里,第四届考试将在2016年6月25-26日举行。
如果您有兴趣接受采访,请微信加好友:trasn863
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15