
互联网和移动互联网时代,程序员成了公认的高薪工作,是众多企业的抢手人才。但凡大学专业沾边计算机的理科生,都有机会去竞逐一下互联网大厂的高薪岗位。
数据时代,数据人才就像之前的程序员成了企业的「香饽饽」,互联网大厂又开始招募大量数据岗位,根据《2020中国数字化人才现状与展望》报告显示,数据人才的需求在不断增加:
数据人才的岗位薪资也高于普通白领平均薪资:
面对这么大好的形势,这次难道没咱们文科生什么事情了吗?「我读的文科,我读的商科,我数学不好,我能学数据分析吗?」这也是我们被问的最多的问题之一。
其实文科生已经意识到自己的竞争对手会是数学好的理科生,所以他们的问题细化成两个就是:
· 如果不是计算机或者数学统计相关专业,他就不能做数据分析吗?
· 想转行数据分析师,应该学哪些技能或者编程语言?
我们根据服务过7万学生的经验,总结了三个关键,帮助文科、商科专业的学生成功找到数据好工作:
· 找对求职途径
· 找准就业企业
· 找好学习方法
进入一家公司一般有两种途径——常规的人力资源(HR)途径和内推途径。HR途径就是通过招聘人员、公司招聘网站、招聘系统,或者申请实习来找到工作;而内推途径则是通过招聘经理或者公司的现任员工来推荐申请工作。
HR途径上会根据硬性的专业要求、学历要求进行筛选,可能在你被面试之前,传统的HR途径因为你没有数学统计或计算机学位而剔除你。但在内推途径中,你通常能够直接地与决定是否录用你的人以及最终与你共事的人或团队打交道。
对于那些只拥有市场营销教育背景的求职者来说,获得一份数据科学家工作的最佳途径就是选择内推。
在BOSS直聘上以「数据」为关键词搜索,得到北京地区的前3226个热门岗位,我们可以看到:
3.1 最热门的岗位
数据分析师,是招聘职位里面最热门的,其次是大数据开发工程师、数据产品经理,说明在产品经理领域,数据的应用也是非常广泛。
3.2 薪酬水平
数据相关岗位的薪酬集中在月薪20-50K之间,部分高薪的可以到月薪50-100K,比如BOSS直聘就在北京以80-100K,16薪,招分布式存储计算平台专家,但要求是10年以上的工作经验,不要被这个工作经验吓到,看看接下来的统计。
3.3 工作经验的要求
我们可以看到工作经验的要求还是集中在1-3年,3-5年,其中经验不限的也占了较大比重,所以有志于从事数据行业的,可以大胆的尝试,这个行业很开放,另一个佐证就是下面的学历。
3.4 学历要求
本科是要求最多的,因此担心学历是不是必须要硕士的可以放心,数据告诉你:本科就满足大部分企业的要求。
3.5 招聘企业
从数据来看,在北京对于数据人才需求最大的企业是京东,接下来是滴滴、理想汽车。
3.6 最需要的技能
SQL、Python,数据分析,是这些数据岗位要求最多的技能。这些技能要怎么掌握,学习方法就至关重要了。
并不是所有想往数据方向发展的人都已经从事过数据相关的工作,但每个人都可以将自己曾经做过的数据相关的项目整理到一起,以此来展示自己在数据领域的工作能力。如果你做过一些很不错的项目,并且将它们展示在你的github或简历上,这将大大提高你找到工作的机会。
4.1 如何选择一个好的项目呢?
关于数据项目的选择,最重要的事情之一是它需要是非常有针对性且具有行业独特性。项目内容越具体、越紧密联系某个你感兴趣的行业,你就能越好地解释这个项目的意义。
选择的项目应该符合下列两个类别之一(或者两者都包括):
(1)这个项目是针对你想进入的某个行业或某份工作设计的——做这类项目可以证明你为什么要申请某个特定的职位。这还说明你对可能从事的领域已有了潜在的了解。
(2)这个项目对你来说是有趣的、有热情的——当你面试时,面试官谈论起这段经历,这一点热情就会变得很明显。当候选人对自己做过的项目感到自豪时,面试官是可以明显感受到候选人在被问到该项目时的那份激情的。
4.2 学习数据技能的最佳路径——「以终为始」的项目学习
你选择的项目应该大致遵循以下这样一个流程,并且在做完项目后你需要能够详细地描述当中的每个步骤。
Step 1: 解决一个实际数据问题——以终为始,课程的最后是怎么的项目?项目背景是什么?是出于什么原因要去做这个项目?(商业问题举例:希望通过历史数据评估营销渠道的效果,以此为明年的营销预算分配提供建议)
Step 2: 数据收集——好的项目要有数据收集的过程,既可以是直接从数据源下载数据集,或者是从某个渠道去使用API爬取。(例如使用python从Twitter上获取tweets相关的数据。)
Step 3: 数据清洗和聚合——这一步实在太重要了。没有这一步的项目都不是“贴合实际工作情况“的好项目。它是数据科学中最重要的一步。对数据格式的处理和清洗会对最终分析的结果产生非常大的影响。你需要通过项目去完全了解你在处理数据时做出决策的原因,比如如何处理缺失值,如何选择或提出某些变量特征,以及如何处理异常值等等。(例如某些天因为技术问题,无法收集到营销支出的数据。)
Step 4: 变量探索——这部分对于一个好项目来说也非常重要。因为在这部分分析中,你要去审视每一个变量的特点。你需要深入研究每个变量(或者叫特征)的分布,并评估这些特征之间的关系。为了显示这些关系,你需要使用诸如箱线图、直方图、相关性图等视觉效果。这一过程有助于告诉你哪些变量和数据可以帮助你解答你想要解决的商业问题。(例如显示每天不同渠道的营销费用的分布图,每天的平均花费。)
Step 5: 数据探索性分析——在这一步,你开始利用数据来探索趋势。可以使用数据透视表来了解变量和变量之间随着时间变化而变化的趋势。可视化的工具也应该在这一环节的分析中被大量运用。与前面一步非常相似,这一步也是帮助你来了解在模型中要放入哪些变量。(例如每个品牌每天的销量、营销支出与销售量之间的散点图,等等)
Step 6: 特征工程(或叫变量转换transformation)——这一步的分析非常重要(所以我将其单独列为一步),然而它通常应与数据分析(Step 5)同时进行。特征工程分为两种:
(1)创建可以提高预测准确性的新特征变量;
(2)改变数据的性质,使其更适合进行量化分析。好的项目会教你,在构建新特征变量时如何充分发挥创造性。你可以使用其他数据进行各种形式的组合,把数据的属性从数值转换成类别(或者反过来),亦或是对某一特征变量应用一个变形的函数。(比如,相比直接显示每一天的绝对数值,你可以利用这一天的数据除以一段时间内的平均值,来创造出可以展示相对概念的变量。)
Step 7: 模型的构建和评估——你应该要比较多个模型,以确定哪个模型对于你需要解决的问题能给出最合理的解释和结果。通过使用训练集和测试集对模型进行交叉验证,你可以看出哪一模型对预测结果准确率更高。同时你还应该特别注意如何去评估模型好坏,能够解释为什么你选择这些评估指标。
(例如比较一个随机森林、lasso回归和支持向量机回归模型来预测产品销量。)
Step 8: 将模型结果进行应用(Optional)——如果面试官看到候选人将她的模型投入运用进了一个真实的网页或API,这会让人印象很深刻。这表明候选人可以使用更高级的编程技术或编程包。我个人偏爱使用python,但是我也看到过其他人把R使用得炉火纯青。(例如在你可以创建一个R Shiny Project,通过对预测指标给予不同的假设来预测销量。)
Step 9: 回顾与展示——你需要回顾你做过的项目,看看在项目过程中遇到了哪些困难,通过什么方法解决,哪些地方可以做得更好,并不是所有项目都可以从始到终进行得很完美)这些都将是你在面试中回答行为问题的宝贵素材。我还建议你可以根据当前项目的发现和洞察来思考和开启下一个项目的主题。(例如我应该在这个分析中考虑如何自动化一些比较手动的流程,是否可以找到其他一些指标来提高模型准确率。)
如果你是“非计算机或者数学统计专业背景”的数据岗位求职者,那么就像上文所说的,你应该遵循以下步骤:
· 找对求职途径——找人内推,而不只是给HR投简历。
· 找准就业企业——去有着更多数据的公司,走上你的数据成长之路
· 找好学习方法——去学习一套完整的数据技能,做有针对性的数据项目。
CDA数据分析师按照CDA认证标准打造的《敏捷算法建模训练营》,完全符合一个优秀的项目的9大必备条件!携手全球领先的咨询公司首席数据科学家,真实还原企业常见的数据科学项目,致力于培养优秀的数据科学家!项目经历可放在简历上提升履历背景。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
如何考取数据分析师证书:以 CDA 为例 在数字化浪潮席卷各行各业的当下,数据分析师已然成为企业挖掘数据价值、驱动决策的 ...
2025-07-15CDA 精益业务数据分析:驱动企业高效决策的核心引擎 在数字经济时代,企业面临着前所未有的数据洪流,如何从海量数据中提取有 ...
2025-07-15MySQL 无外键关联表的 JOIN 实战:数据整合的灵活之道 在 MySQL 数据库的日常操作中,我们经常会遇到需要整合多张表数据的场景 ...
2025-07-15Python Pandas:数据科学的瑞士军刀 在数据驱动的时代,面对海量、复杂的数据,如何高效地进行处理、分析和挖掘成为关键。 ...
2025-07-15用 SQL 生成逆向回滚 SQL:数据操作的 “后悔药” 指南 在数据库操作中,误删数据、错改字段或误执行批量更新等问题时有发生。 ...
2025-07-14t检验与Wilcoxon检验的选择:何时用t.test,何时用wilcox.test? t 检验与 Wilcoxon 检验的选择:何时用 t.test,何时用 wilcox. ...
2025-07-14AI 浪潮下的生存与进阶: CDA数据分析师—开启新时代职业生涯的钥匙(深度研究报告、发展指导白皮书) 发布机构:CDA数据科 ...
2025-07-13LSTM 模型输入长度选择技巧:提升序列建模效能的关键 在循环神经网络(RNN)家族中,长短期记忆网络(LSTM)凭借其解决长序列 ...
2025-07-11CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-11数据透视表中两列相乘合计的实用指南 在数据分析的日常工作中,数据透视表凭借其强大的数据汇总和分析功能,成为了 Excel 用户 ...
2025-07-11尊敬的考生: 您好! 我们诚挚通知您,CDA Level I和 Level II考试大纲将于 2025年7月25日 实施重大更新。 此次更新旨在确保认 ...
2025-07-10BI 大数据分析师:连接数据与业务的价值转化者 在大数据与商业智能(Business Intelligence,简称 BI)深度融合的时代,BI ...
2025-07-10SQL 在预测分析中的应用:从数据查询到趋势预判 在数据驱动决策的时代,预测分析作为挖掘数据潜在价值的核心手段,正被广泛 ...
2025-07-10数据查询结束后:分析师的收尾工作与价值深化 在数据分析的全流程中,“query end”(查询结束)并非工作的终点,而是将数 ...
2025-07-10CDA 数据分析师考试:从报考到取证的全攻略 在数字经济蓬勃发展的今天,数据分析师已成为各行业争抢的核心人才,而 CDA(Certi ...
2025-07-09【CDA干货】单样本趋势性检验:捕捉数据背后的时间轨迹 在数据分析的版图中,单样本趋势性检验如同一位耐心的侦探,专注于从单 ...
2025-07-09year_month数据类型:时间维度的精准切片 在数据的世界里,时间是最不可或缺的维度之一,而year_month数据类型就像一把精准 ...
2025-07-09CDA 备考干货:Python 在数据分析中的核心应用与实战技巧 在 CDA 数据分析师认证考试中,Python 作为数据处理与分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的有力工具 在数据分析的广袤领域中,准确捕捉数据的趋势变化以及识别 ...
2025-07-08备战 CDA 数据分析师考试:需要多久?如何规划? CDA(Certified Data Analyst)数据分析师认证作为国内权威的数据分析能力认证 ...
2025-07-08