
大数据时代,你的角色是什么
大数据时代,不懂点数据分析都不好意思告诉别人你混互联网、混大都市的,在大数据的环境下,我把市场上的分析师分为几类
一、数据变现者
这类人一直在公司从事这业务分析的角色,他们一直在尝试用数据去改变业务决策的流程变更和机遇,驱动这企业的北极星指标,更多做的事情是对业务驱动的输出而不是简单的输入,他们要考虑目前的现状、改变的机会、未来的方法,所以数据只是让他们的思维更加严谨,更有穿透力,简单的就是ABtest、用户增长的驱动模型、用户生命周期管理方案、营销分析模型等,一直在实战中去挑战自己对数据分析的看法和认识,也未必完全依赖数据,工作的环境很容易让数据+行动变成闭环,从而不断是积累洞察力
更多的思考集中在:
1、市场推广费用如何能在有限的资源做到最大化的ROI
2、用户的发展趋势和质量存在什么问题?结构如何?如何增活跃,防流失
3、提高转化的方式是什么?口碑的形成主要驱动因素是什么?
4、现阶段我们的组织结构和业务的融合度该如何调整?
5、整体市场环境如何?我们的地位稳健吗?还有没有新的发展机会
等等,记住他们的输出不是一份报告那么简单,而是整个商业问题的输入
工具对他们来讲已不是核心,常用的就两种Excel+PPT,地位不高,自己学点SQL
二、提数机器人
他们一直都被别人牵着走,可能是高级数据分析师、也可能是业务部门,也可能是甲方,别人要什么,我做什么,当然经常出现的问题就是要非所答,甚至是被推倒,重来,所以他们不得已要去学习数据库知识,知道了土壤很肥沃才能明白要种什么植物,收成是什么?许多时候他们什么都要去学习,身怀各种绝技,没办法,你不去掌握,每天的需求是无限增长,你不熟练、不找对应的高效工具,非搞死自己不可,市场上80%的数据分析师都是这类人,凡是市场上见到的技术、算法基本都学了一篇
三、技术研究者
在人工智能、机器学习还没火的时候,有一个岗位一直做技术类的研究,那就是数据挖掘,整天每日每夜的折腾各种数据分析模型,甚至把模型开始的变量无限的去增加,以前20个变量做出来的模型可能效果是最好的,最后在自己手上把变量增加到成千上万,做的自己都找不到东南西北了,没办法,从数据科学的角度来讲,变量越多,考虑的越全面,数据量越大做出来的模型越精确,然而仍然会出现你在某电商网站买个铁锅,他会在下面再推荐你买个纲锅.....
有些事情不是纯算法能够解决的,人与人的不同造成了场景和流程也是截然不同的
现在人工智能火了,许多人一头扑向AI领域,为啥?人家都是年薪100万的,至少都50w起,谁不心动?可是仔细想想,这条路到底适不适合自己,毕竟每个行业都有一些“异常值”,而且是少数,且不要断章取义、局部去看这个行业的发展,那样其实你无形中让自己的竞争力再削弱,一波浪过去,总有很多裸泳的,自信的游泳健将
四、各类神仙
到处站在讲台上忽悠大数据的价值和未来,他们甚至连一个很小很小的项目经历都没有,没办法,他们能洞察市场、洞察客户的痛点,用别人的知识、自己的认识包装自己,他们更多数据的是数据价值未来的畅想、完美的数据平台建构。从来不考虑数据获取和标准的问题,毕竟这些在他们看来太LOW
在这样的环境和分类下,我们该如何高效去学习?
那么不管你未来或者现在是那类分析师,都要保持一个常态心去学习,在这个行业走的越深,你才会发现数据分析师最后已经不是简单数据的加工者、PPT的汇报者、成果的宣讲者,而是一个多知识领域的布道者,你在在不断去尝试将管理学、经济学、社会学、行为学等与数据分析相融合去看待一个商业的sense,从而慢慢形成做事、决策时候的逻辑和结构化思维,比如如何在整个业务流程设计关键的启明星指标或者北极星指标
图来自:秦璐文章
要走的更远,首先,要先建立自己的思维能力,对数据分析的认识,而不是上来就学习数据分析的各类工具
比如我们的报告中会有很多的指标,许多人在写发现什么的时候总是,说用户数增加了多少,增长几个点,市场费用多少,ROI环比下降几个点,与竞争对手相比,我们的优势指标体现在?不足之处等,其实站在高层的角度你是将图表反馈的信息“念”出来了,聪明的分析师会这么干?
从规模效应来看,我们用户量、GMV、排名如何?
从盈利来讲,GMV表现如何,市场费用支出、ROI达到的成效是什么样子
从资源优化来说.....
这些让老板看着你还有点自己的知识体系,能够将发现的问题懂得去归类,去思考什么是规模指标、什么是盈利指标、什么是资源优化关注
其实还不够,还是没有告诉领导数据发现了那些洞察
举个栗子:用户量增加,活跃用户下降,GMV增加、市场费用也增加,那这些指标之间到底出现什么问题,应该用什么方案能解决这个问题?谁来解决?黑锅总要有人去背?
分析完以后一定要梳理出好与坏,好与好之间的关系,再从几个方面去描述,你会发现你的思路和出发点是不一样的,老板就喜欢色香味俱全的菜品
其次,在上面的深度思考和分析下,才是什么样的工具解决什么样的数据难题,比如公司有数据库,每次都要去提交申请才有可能拿到数据,等数据来了,其实你当时的许多思考已消失了一部分,那能不能有一天你走到你们老大面前,说我也会数据库,也会SQL语法,可以自己慢慢去提取想要的数据,你对底层越了解,采集和存储的体系越清晰,你在部门的竞争力才越强,因为你能独当一面,所以后面的升职加薪水到渠成
学习一门技术之前,你应该知道,你想要达成的目标是什么样的,也就是说,你想通过这门技术来解决哪些问题,应用在哪些行业,哪些业务场景下。只有这一点想通了,你的数据分析之路的学习才是高效的、有目的的、有意义的。
再比如有一天程序员给你发来一个20G文件的时候,你一脸懵逼(因为你平时可能处理的只有excel+access的几千万行),而面对20g文件的时候袖手无策,还怕影响项目进度,本月考核出现在黑名单,在职场有时候是自私的,自己动手丰衣足食,你经历的越多,你以后的坑会越少,所以他们逼着你去学python+hadoop+spark这些,当有一天领导让你做述职报告时,你一直做的是人机交互,连一个像样的PPT都梳理不出来,如何给领导惊喜?
我从工具的层面去梳理要学习那些工具?这些工具足够解决掉你商业或者工作上99%的问题
所以学工具有时候是逼出来的,毕竟工欲善其事必先利其器
当然我们也要根据自己的处境去选择,过早的学习,到真正用的时候你依旧会忘记,到临时需要时你却一脸懵逼,一定要找一个自己适合的工具死磕到底,别的工具只需要掌握,天下套路那么多,你总要有自己的套路,也有很多稳固的方式
1、找一些竞赛的数据,自己没事折腾一下
2、多去看看相关的论坛,有事没事回答一下,溜溜自己的知识
3、找一些圈友写一些自己操作的实录或者自己的网站等,让知识沉淀
最后,所有的学习都是态度问题,不能着急,我们只有在好的体系、好的课程质量体系下,自己才能在有效的时间成长的更快,有时候也是当局者迷,要尝试和身边的人或者同行去分享一些自己的认识,往往武侠小说里面,速练成的武功往往对自己以后伤害更大,反而拥有一本武林秘籍,能让自己成就大梦,大家都知道一个道理:
一份数据给不同的人做出来的肯定是不一样的,因为没有分析的目标
一个明确的需求给做出来的肯定有一个是最好的,因为他思你所思,想你非想
几点建议:
1、多看看知乎上的深度交流,为你所用
2、多关注行业的变动,没事去各大招聘网站看看需求的变化
3、少看点新闻,它不能让你加薪升职,哈哈~~~
4、圈友们彼此之间多多交流,你的观点只有和别人发生博弈时,你才有深思
5、多看一些跨学科的书籍,跨行业的报告,让知识体系丰富起来,那样你才有体系化思考的资本
6、坚持每天写点什么,日积月累你才有出众的根基,所以文科生学数据分析成长要比理科生高很多,他们善于表达撰写
7、选择那些有一线实战经验讲师的课程,他们才能让你少走弯路,少采坑
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15