
数据分析师谈如何走上数据分析之路的
以下引子英国数据分析师的口述整理:
我本科毕业于一个三流的二本院校,专业是三流中的三流—市场营销。大学前三年在各种游戏中度过,连兼职和实习的经历都没有。到大四的时候突然开始恐慌,觉得这样下去连工作都找不到了,于是立马开启了考研的节奏。可是突然发现已经三年没有学习的我再也难以重新捡起书本了,再加当时EX因为准备出国要和自己分手,我简直觉得自己到了穷途末路。
你以为这就是故事的全部吗? 如果一个故事里面没有一点狗血的剧情,那还怎么能称之为故事呢? 是的,我的故事也很狗血,我当时死了命的要出国去追我的EX,于是和父母百般商量,他们最终同意我出国(我家境还好,出国的钱不是问题)。 EX和我分了没多久,又立马找了个新对象,我简直就是TM$#@$&*@#@#%^(此处省略1万字)。 心灰意冷啊,可是我还是抱有希望,觉得等到国外就好了。
于是在每个寂寞伤心的夜里,我睡不着觉都抱着厚厚的一本雅思口语书在学校的小池塘边上读英语。你能想象半夜两三点我一个人在那读英语的场景吗? 不是因为我喜欢英语啊,只是我不能让自己停下来,要不然满脑子都是EX啊。 最终的最终,我的雅思竟然拿了个7,最让人不可思议的是我竟然成功申请到了一所世界排名前100的名校。这算是逆袭吗?
当时申请国外的专业是随便申请的,哪有心思去选专业啊,满脑子都是EX。 可是就是没想到这个随便的选择,竟然给我带来如此大的影响,我甚至觉得这个选择会影响我的一生。 在此,我说一句,如果你有钱,请一定要去国外学个一两年,你的人生观一定会被改变。如果你觉得我说的不对,尽情的喷我吧,但是我还是保持我的观点。出国改变一生!!!!
我提着大包小包的行李一路奔向了大不列颠的领土,第一感觉就是空气真他妈的好。蓝白白云,鸟语花香,隔壁就是火车站和码头。去学校报道的时候惊讶的发现,我的这个专业竟然只有11个人,不可思议,教授都比学生多啊。隔壁的市场营销70个人啊,简直秒杀我们。
我的专业叫市场分析,可是真的和市场打不着半毛子的关系。我们每天学的是数据,统计学,概率论,数据挖掘还有各种蛋疼的编程。我和我的小伙伴们都惊呆了!! 从那时起,基本上就开启了熬夜战斗的模式,一熬就是一年多啊。每每夜里12点我们都会在机房被保安“赶出来”,空荡荡的校园只剩我们专业小伙伴的身影,那时候真的体会到什么叫“痛并快乐着”。虽然很苦,但是很充实,很开心。
有段时间学SAS,因为从来没接触过编程和数据挖掘,课程难度很大。基本上在上完课后都会去图书馆编程,平均每天都要10个小时左右,一个星期后,我的眼睛被搞坏了,一看到荧光屏就开始疼痛,只能通过不断的点眼药水来减轻酸痛,虽然这样,自己还是坚持把SAS学完,依然每天学习10来个小时。等到SAS课程结束后,我真的是累到了,几个同学送我去医院做检查,医生让我不要再使用电脑,我的双眼已经严重疲劳,泪腺已经被堵住了。。。。。
于是我便抛下一切,去法国和西班牙玩了几天!
我在英国的这一年,周一到周五基本上都是在图书馆呆着的,周六周日会出去喝酒,旅游。日子真的很惬意,现在每每想起都十分怀念。也是在英国这一年让我学会了独立,尤其是独立思考,养成了读书的习惯,懂得了追求进步以及享受到通过努力取得成功的那种快感。
上面讲得有点乱,没有什么干货,主要是讲一讲自己的经历。下面给大家将一些干货吧,主要关于是我如何在一年之内学完数据分析的。
第一门课程叫做定量分析,其实就是统计学,总共6个课时,每个课时4个小时。讲课内容无非就是统计学的那点知识,国外的老师都是只讲一个框架,然后给一大堆参考文章和书籍自己回去阅读和思考。这些书和文章是一定要看的,而且要仔细的看,因为考试会考到。统计学是整个数据分析的基础,大家一定要学好。多阅读课本,最好有两本能够互相参考。
接下来学的一门课是多元统计分析,用的时SPSS软件,3个课时,每课时4小时。自学时间大概是60个小时。这部分主要侧重应用,大家可以阅读Discovering Statistics by Using SPSS. 作者是大名鼎鼎的Andy Field,出了名的心理统计学家。 书讲得很详细,既涉及到统计学知识,也涉及到如何使用SPSS进行数据分析。
还有两门数据分析课程,一门是讲解卡方检验,方差检验等技术手段的,这个没有指定书籍,只有一大堆的参考文献,其实这些方法在统计学教材里都会有,只不过老师单独的列出来进行讲解了。这门课非常有用,让我们对常用的数据分析技术得到了更深一步的理解。另一门课程叫高级数据分析,是讲 如何使用R进行多元数据分析的,这门课主要的教材就是 R in Action,这本书在我们的电子版教材里有提供给大家,绝对是学习R语言的最佳书籍,没有之一。
接下来的这门课是 使用SAS进行多元统计分析,学时3课时,每课时6个小时。讲课的是一个黑人教授,非常的有范,每次都逗我们一帮人笑翻天。虽然SAS只有三个课时,可是学的东西却非常多。从基础的数据管理,清洗,到高级的数据建模,诊断,都要在三个课时内学完并消化。 SAS的作业也是相当的变态的,需要我们自己去设计一个调查问券,然后自己出去发问卷进行调查,最后将数据导入到SAS中进行分析。这整套过程就像在做一个项目,非常的实用,也非常的锻炼人。现在工作了也觉得,当初老师那样做真的是让我们受益匪浅,我懂得了任何的数据分析都需要结合业务去开展。
还有一门课叫做信用风险评估和数据挖掘,这门课是和banking的学生一起上的。用的软件是SAS Enterprise Miner,这是SAS公司针对商业数据分析研发的专业软件,非常的好用,在我推荐的电子书籍里也有很多关于此软件的。 SAS EM是一个菜单化的界面,可以让你通过拖拽图表进行数据挖掘,简单易用。 我在英国花了很长时间研究这个软件,如今在公司里用起来得心应手,看到我的同事煞是羡慕。
有一门课叫做定性分析,这是与定量分析相辅相成的一门学科,很锻炼人的思维。这门学科不涉及数据,是从文字的角度让我们去思考一个项目,通过收集到的文字资料进行文本分析,挖掘出资料当中潜在的有价值的信息,得出最初的结论。再结合定量分析,使用数据分析对自己的判断进行佐证。 这个学科还有一个很出名的软件,叫做nvivo,大家百度一下便知道,我们当时也是使用该软件进行的定性分析。
还有一门课叫做数据收集,就是学会如何去收集我们所需要的数据,收集完之后该如何保存,修改,清洗。 收集数据是一门艺术,并不是简单的去网上下载或者去图书馆查找资料。我们需要将一个问题转化成可以量化的事件,然后根据此事件去收集数据。
最后一门课叫做 网页分析,使用的是谷歌分析。就是统计网站的IP量,用户数,点击数,用户路径等指标。当然谷歌分析的内容远远不止这些,我们可以通过谷歌分析研究用户行为,评估网站质量等。 我想,只要是互联网公司,都会放大量的财力、人力、精力在网页分析上的。所以这门课的重要性不言而喻。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01