京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析师谈如何走上数据分析之路的
以下引子英国数据分析师的口述整理:
我本科毕业于一个三流的二本院校,专业是三流中的三流—市场营销。大学前三年在各种游戏中度过,连兼职和实习的经历都没有。到大四的时候突然开始恐慌,觉得这样下去连工作都找不到了,于是立马开启了考研的节奏。可是突然发现已经三年没有学习的我再也难以重新捡起书本了,再加当时EX因为准备出国要和自己分手,我简直觉得自己到了穷途末路。
你以为这就是故事的全部吗? 如果一个故事里面没有一点狗血的剧情,那还怎么能称之为故事呢? 是的,我的故事也很狗血,我当时死了命的要出国去追我的EX,于是和父母百般商量,他们最终同意我出国(我家境还好,出国的钱不是问题)。 EX和我分了没多久,又立马找了个新对象,我简直就是TM$#@$&*@#@#%^(此处省略1万字)。 心灰意冷啊,可是我还是抱有希望,觉得等到国外就好了。
于是在每个寂寞伤心的夜里,我睡不着觉都抱着厚厚的一本雅思口语书在学校的小池塘边上读英语。你能想象半夜两三点我一个人在那读英语的场景吗? 不是因为我喜欢英语啊,只是我不能让自己停下来,要不然满脑子都是EX啊。 最终的最终,我的雅思竟然拿了个7,最让人不可思议的是我竟然成功申请到了一所世界排名前100的名校。这算是逆袭吗?
当时申请国外的专业是随便申请的,哪有心思去选专业啊,满脑子都是EX。 可是就是没想到这个随便的选择,竟然给我带来如此大的影响,我甚至觉得这个选择会影响我的一生。 在此,我说一句,如果你有钱,请一定要去国外学个一两年,你的人生观一定会被改变。如果你觉得我说的不对,尽情的喷我吧,但是我还是保持我的观点。出国改变一生!!!!
我提着大包小包的行李一路奔向了大不列颠的领土,第一感觉就是空气真他妈的好。蓝白白云,鸟语花香,隔壁就是火车站和码头。去学校报道的时候惊讶的发现,我的这个专业竟然只有11个人,不可思议,教授都比学生多啊。隔壁的市场营销70个人啊,简直秒杀我们。
我的专业叫市场分析,可是真的和市场打不着半毛子的关系。我们每天学的是数据,统计学,概率论,数据挖掘还有各种蛋疼的编程。我和我的小伙伴们都惊呆了!! 从那时起,基本上就开启了熬夜战斗的模式,一熬就是一年多啊。每每夜里12点我们都会在机房被保安“赶出来”,空荡荡的校园只剩我们专业小伙伴的身影,那时候真的体会到什么叫“痛并快乐着”。虽然很苦,但是很充实,很开心。
有段时间学SAS,因为从来没接触过编程和数据挖掘,课程难度很大。基本上在上完课后都会去图书馆编程,平均每天都要10个小时左右,一个星期后,我的眼睛被搞坏了,一看到荧光屏就开始疼痛,只能通过不断的点眼药水来减轻酸痛,虽然这样,自己还是坚持把SAS学完,依然每天学习10来个小时。等到SAS课程结束后,我真的是累到了,几个同学送我去医院做检查,医生让我不要再使用电脑,我的双眼已经严重疲劳,泪腺已经被堵住了。。。。。
于是我便抛下一切,去法国和西班牙玩了几天!
我在英国的这一年,周一到周五基本上都是在图书馆呆着的,周六周日会出去喝酒,旅游。日子真的很惬意,现在每每想起都十分怀念。也是在英国这一年让我学会了独立,尤其是独立思考,养成了读书的习惯,懂得了追求进步以及享受到通过努力取得成功的那种快感。
上面讲得有点乱,没有什么干货,主要是讲一讲自己的经历。下面给大家将一些干货吧,主要关于是我如何在一年之内学完数据分析的。
第一门课程叫做定量分析,其实就是统计学,总共6个课时,每个课时4个小时。讲课内容无非就是统计学的那点知识,国外的老师都是只讲一个框架,然后给一大堆参考文章和书籍自己回去阅读和思考。这些书和文章是一定要看的,而且要仔细的看,因为考试会考到。统计学是整个数据分析的基础,大家一定要学好。多阅读课本,最好有两本能够互相参考。
接下来学的一门课是多元统计分析,用的时SPSS软件,3个课时,每课时4小时。自学时间大概是60个小时。这部分主要侧重应用,大家可以阅读Discovering Statistics by Using SPSS. 作者是大名鼎鼎的Andy Field,出了名的心理统计学家。 书讲得很详细,既涉及到统计学知识,也涉及到如何使用SPSS进行数据分析。
还有两门数据分析课程,一门是讲解卡方检验,方差检验等技术手段的,这个没有指定书籍,只有一大堆的参考文献,其实这些方法在统计学教材里都会有,只不过老师单独的列出来进行讲解了。这门课非常有用,让我们对常用的数据分析技术得到了更深一步的理解。另一门课程叫高级数据分析,是讲 如何使用R进行多元数据分析的,这门课主要的教材就是 R in Action,这本书在我们的电子版教材里有提供给大家,绝对是学习R语言的最佳书籍,没有之一。
接下来的这门课是 使用SAS进行多元统计分析,学时3课时,每课时6个小时。讲课的是一个黑人教授,非常的有范,每次都逗我们一帮人笑翻天。虽然SAS只有三个课时,可是学的东西却非常多。从基础的数据管理,清洗,到高级的数据建模,诊断,都要在三个课时内学完并消化。 SAS的作业也是相当的变态的,需要我们自己去设计一个调查问券,然后自己出去发问卷进行调查,最后将数据导入到SAS中进行分析。这整套过程就像在做一个项目,非常的实用,也非常的锻炼人。现在工作了也觉得,当初老师那样做真的是让我们受益匪浅,我懂得了任何的数据分析都需要结合业务去开展。
还有一门课叫做信用风险评估和数据挖掘,这门课是和banking的学生一起上的。用的软件是SAS Enterprise Miner,这是SAS公司针对商业数据分析研发的专业软件,非常的好用,在我推荐的电子书籍里也有很多关于此软件的。 SAS EM是一个菜单化的界面,可以让你通过拖拽图表进行数据挖掘,简单易用。 我在英国花了很长时间研究这个软件,如今在公司里用起来得心应手,看到我的同事煞是羡慕。
有一门课叫做定性分析,这是与定量分析相辅相成的一门学科,很锻炼人的思维。这门学科不涉及数据,是从文字的角度让我们去思考一个项目,通过收集到的文字资料进行文本分析,挖掘出资料当中潜在的有价值的信息,得出最初的结论。再结合定量分析,使用数据分析对自己的判断进行佐证。 这个学科还有一个很出名的软件,叫做nvivo,大家百度一下便知道,我们当时也是使用该软件进行的定性分析。
还有一门课叫做数据收集,就是学会如何去收集我们所需要的数据,收集完之后该如何保存,修改,清洗。 收集数据是一门艺术,并不是简单的去网上下载或者去图书馆查找资料。我们需要将一个问题转化成可以量化的事件,然后根据此事件去收集数据。
最后一门课叫做 网页分析,使用的是谷歌分析。就是统计网站的IP量,用户数,点击数,用户路径等指标。当然谷歌分析的内容远远不止这些,我们可以通过谷歌分析研究用户行为,评估网站质量等。 我想,只要是互联网公司,都会放大量的财力、人力、精力在网页分析上的。所以这门课的重要性不言而喻。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16