
随着大数据和人工智能时代的到来,传统企业开始向数据化和智能化转型。由此,数据分析师相关岗位的需求量逐年递增,近两年呈现出供不应求的状况,在未来很长一段时间这种需求还将继续保持下去。作为过来人,我也算是苦尽甘来啊。想想自己当初为了转行数据分析师行业,付出了多少心血和汗水。
相信还有很多像我一样计划转行或已经准备好转行的朋友,为此,我特地给大家分享了我的专业数据分析师经验之谈,让大家可以更加直观地了解当下数据分析师的行业情况和职位需求。
为了帮助大家对数据分析师相关职位的目前发展状况有个清晰明了的认识,本文通过分析“数据分析师”在全国招聘信息的城市需求、职业门槛、各公司要求情况,以及当下各大企业的人才需求状况,使用数据分析工具Python,包括数据的获取、清洗和可视化的呈现,就为了帮助大家更好地了解数据分析师这个职业。本文所用数据均来源于BOSS直聘的近期数据分析师的全国招聘信息。,绝对客观真实有效!
分析流程
01
明确分析目的
明确分析目的是数据分析的首要的、关键的步骤。在开始一项数据分析前,首先要清楚我们想解决什么问题?通过这次分析想达到一个什么样的效果?下面列出了本次分析的几个目的:
1)了解各城市对数据分析师的需求;
2)数据分析师这个职业的门槛有多高;
3)了解招聘公司情况;
4)了解各行业对数据分析师的需求;
4)了解数据分析师的薪资情况。
02
获取相关数据
明确分析目的后,接下来要做的就是为了解决这些问题,有针对性的获取相关数据。之所以说“有针对性”,是因为并不是数据越多越好,数据越多,我们的抓取、清洗成本也就越高,只有对本次分析有用的数据才是有价值的数据。因此,根据我们的分析目的,本文用Python从BOSS直聘中抓取了如下字段信息:公司名称,公司地址,公司规模,融资情况,所属行业,职位名称,经验要求,学历要求,薪资。源数据格式如下:
03
数据清洗与规整化
得到源数据后,还需要对其进行清洗和规整化后才能进行分析,一般包括清洗、转换、合并、重塑。下面本文使用Python对源数据进行处理:
1) 导入包
2) 缺失值处理
3) 删除重复值
4) 提取城市名
5) 删除空格
6) 提取最低薪资和最高薪资
7) 数据重塑
04
数据可视化分析报告
1. 城市需求分析
初步观察可知,数据分析师的需求主要集中在大城市,其中排名前十的分别是北京、上海、深圳、杭州、南京、广州、东莞、合肥、天津、武汉。其中北京的需求远远超过其它城市,接近上海和深圳的需求总和。
数据分析师职位在城市地理分布上,主要集中于北上广深、长江三角洲、沿海地区。中国内陆地区需求较少,一般集中于省会城市。
2. 职业门槛分析
在学历要求上,数据分析师的门槛相对较高,80.2%的公司要求至少本科学历,4.8%的公司要求硕士学历。因此对想从事数据分析师职业的人员来说,本科学历是必要的敲门砖。
在工作经验要求上,大部分公司对工作经验都有较高要求,其中3-5年工资经验的数据分析师最受欢迎,需求达到37.9%;其次就是1-3年经验的数据分析师,需求达到31.1%。因此,一定的行业工作经验能帮助数据分析师求职者快速找到工作 ,而应届生和无工作经验者只有提高自己的专业技能,才能获得竞争优势。
3. 公司情况分析
对于招聘公司的融资情况上,上市公司居多,达到33.4%;在公司的规模上,大公司对数据分析师的需求更多,其中1000-9999人规模的公司最多,达到45.4% ,其次是10000人以上规模的公司,达33.8%。
4. 行业需求分析
在下面词云图中可以看出,数据分析师涉及的行业十分广泛,供求职者的选择空间很大,其中各行业中,互联网、电子商务、金融、医疗健康、计算机软件等行业的需求量最高。
5. 薪资分析
(1)工作经验和学历对薪资的影响
总的来说,工作经验的长短和学历的大小基本跟薪资的高低是成正比的,工作经验越长,学历越高,薪资也会越高。
在工作经验上,拥有十年以上经验者平均起薪已经超过25000,5-10经验者平均起薪在20000左右,3-5年经验者平均起薪接近15000了,而三年以下和无经验者平均起薪则在10000以下。由此可看出,数据分析师对工作经验的要求还是比较高的,对行业和业务熟悉的人薪资会更高,同时也说明这个职业有很大的上升空间,“越老越值钱”,看重资历。
在学历上,本科和硕士的平均起薪相差2000左右,差别不是很大,但本科以下学历,平均起薪就相对较低了,一般不超过6000。
因此,本科学历是数据分析师高薪的门槛,拥有本科学历和3年以上工作经验是数据分析师高薪的敲门砖。
下面展示的是数据分析师职业需求前十的城市起薪的分布状况。容易看出,北京、上海、深圳、杭州的平均起薪都在15000左右,而广州只有10000左右,南京则在7500左右。
对于北京,数据分析师的平均起薪分布对称,比较符合正态分布;上海、深圳、南京呈右偏分布,其中上海、深圳高薪资职位相对较多,南京有个别公司起薪异常高。杭州、广州呈左偏分布,半数职位起薪在10000以下,个别职位薪资不超过5000,远远低于平均水平。
因此,在北京、上海、深圳三个城市能有更大的概率找到高薪的数据分析师职位;其次是杭州、广州,虽有部分公司薪资较低,但平均工资还是比较可观;而南京虽然需求较多,但高薪职位相对较少,大部分职位工资都不超过10000,集中在3000-7500中间。
05
分析总结
本文从多角度分析了BOSS直聘近期数据分析师的招聘信息情况,对数据分析师有如下几点总结:
1)北上广深、长江三角洲、沿海地区是数据分析师的集中地区,其中,北京的需求远远超过其它地区,若想从事数据分析师职业,在北京机会最多。
2)本科学历、3-5年以上工作经验的数据分析师成为最受公司欢迎的“香饽饽”,并且平均薪资也相对较高,在15000左右。
3)上市公司、1000-9999的大公司对数据分析师的需求更高;
4)互联网、电子商务、金融、医疗健康是数据分析师首选的几大行业。
5)在北京、上海、深圳寻找高薪职位的概率更大。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15