京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析师的情怀,一个大数据工作者的感悟
1、大数据圈子里的毛病
从我接触大数据到现在,我看到了它的兴起,国家政策的大力倡导,以及未来的潜在趋势。但说心里话,我感觉不温不火——像极了便秘,看似吃奶的劲,却半天蹦不出个屁来。而且有些方面朝着一种病态的方向发展,我是挺担忧的,不知道你们了?
一直以来,我都是在接触数据产品相关的事,至始至终,国内真正领悟大数据产品精髓核心的人不多,拿出手有价值的数据产品更是屈指可数(今天也不是谈数据产品的)。难道大数据的价值在一款跨时代的数据产品身上这么难体现?
很纳闷,观察了很久。归根到底,关键性因素是“数据情怀”惹得祸。为什么这样说,很多身处在大数据领域的人,很缺乏真正意义上的那一股劲——“数据情怀”,去推动着这个行业的真正成长,不管是做培训也好,做产品也好,传道授业也好。而这股劲,直接影响你在为这个领域的蓬勃发展,不吹嘘,真才实干,贡献多大的力量罢了。
2、数据分析师的情怀是什么?
谈到这里,不免而然的又需要聊下,我理解中,数据情怀都体现在哪些?概括起来,以下几个词:
初心 | 使命感 | 快感 |共鸣与傲娇
这并不是鸡汤那一套,这只是我本人对待大数据的一种态度,分享而已,寻找共鸣。分别举几个故事吧。
初心:不忘初心,方得始终
谈起当初为什么会选择大数据领域,我也才是一个学通信的人而已!
最近,有位朋友在分答上向我提过这样类似的问题,原话是:你是如何赶上机遇选择这个领域的?是热爱,还是仅仅偶然?(我没回答这个问题,打算今天一起聊了)
我很理解这个提问的出发点,因为我知道现在大数据圈子里,有这样一个现象:
很大一群准大数据人,还正在培训班里或者自己学习着。
一部分转型做数据开发的大数据人,工作年限在5年左右及以上,更多是从Java开发转行过来做大数据框架这套东西的,真正接触大数据时间也就在2年之内。
这样的转型,除了职业规划,也包含着薪酬水平。如果真正纯正的,应该也是在2012年靠后,就开始接触大数据的这一群人,不过很少,很幸运自己就算是一个。
故事一:我与数学的藕断丝连
我的确是学通信的,我也压根没打算学数学专业。可我从小到大数学都很厉害啊,很多时候都是分最高的(太老套路了,数学好的人多去了)。自己一路以来,转变过很多方向,但都是在寻找一个答案(学数学的意义)。
大学以前,数学一直不错,很多时候都是最高分,上了大学后,还曾经为了哥德巴赫猜想熬夜专研过,十分兴奋,当然也没这么容易被我证明出来。但后来想明白了,觉得数学这一套公式的计算、求证和推导,压根不是我感兴趣,想探索的,直接拉倒。
后面在大学,有机会接触到数学建模,顷刻间觉得它是应用数学在实践中的真正应用,是一种知识的融合和思考问题的突破,结果也是获奖无数。总共参加11次比赛,一次去深圳参加夏令营遗憾获得了三等奖(全国很多高校,包括清华、复旦等,百度可搜到我回答问题的照片,被选着成为新闻素材),最后一次无心参加的美国建模二等奖,剩余都是一等奖(其中也包括全国大学生数学建模一等奖)。这里并不是晒优秀,太老套路了,能获好成绩的人多去了。后来想明白了,觉得以比赛性质存在的这应用数学,花几天时间交上去的论文,都是狗屁不通,全是忽悠和抄袭,还是没找到数学真正价值的存在。
这时,大数据来了,我觉得大数据或许能够找到数学,乃至数据真正的意义,这的确是我喜欢瞎折腾的一个初心——我太想在自己身上找到数学存在的意义了,所以当时第一个想法是,玩转数学。刚开始总是围绕数据源打转,做一些类似阿里指数那样的大数据报表,总想把各种大数据生态圈底层的开发技术都了解遍,费力不讨好,压根也没有体现出大数据真正的价值在何处?
后面,在从事大数据领域过程中,也又转变了一些方向,有幸多次参加与一家美妆公司老板,甚至是一些高层的调研,花了一个多月的时间,慢慢领悟到业务真正需要数据为它做什么?业务方需要什么样的数据产品?数据真正的价值,原来潜力很大,只是还少有人去探索成功罢了。
这是自己目前做的事,又找到折腾的事,至少我这一路的初心,都是在寻找数学,乃至数据的价值。并不是每个从事大数据圈子里的人,都必须要像我这样折腾,但至少你需要思考一下,当初选择进入这个圈子的初心,是有执着?还是追潮流罢了?
使命感:人这一辈子,能折腾的事不多,用心做好每一件事
故事二:我微信朋友圈,一些活跃的,有典型的数据人有特别专注智能金融的捷哥,一个从国外回来创业,想在互联网金融这个行业探索数据价值的人群。有天天吟诗作乐,深深陶醉在大数据情怀的高总,一方面也顾着大数据人才思维培养的重任。
有自由职业,但却天天飞这飞那培训的黄老师,一直重视着业务与数据紧密结合,推广着自己写的书(@数据化管理:这好像是说我)。
有想在目前培训行业,做出一番贡献,一直默默筹备着机会的老李,充满了情怀,利志于打破目前大数据培训的混乱。
…
数据圈子里,有着这样的一些人,我不熟悉的,还会有一些这样的人。他们感觉自己充满了使命感,傻傻的,即使迷途惆怅,也坚信光明就在远方。我喜欢这样的一群人,只是在数据圈子里面,太少太少了。
故事三:一些无心,大忽悠,特立独行的数据人
踏入大数据圈子,也仅仅是为了转型,为了薪酬,为了养老,我并不想真正做出点啥。
躺到一定年限,慢慢也具备一定的忽悠资本,酷爱说一些很潮流的大数据技术,但做起大数据的事,很难产。
拥有一定专业技能,但总在小圈子里钻,认为不断学技术,才是存在感。却不知技术本身的真正意义和价值,难应用于业务。
我这样一个人,对于规划过的产品,写过的文章,做过的培训,我十分重视,觉得它代表我的态度和使命感。特别怕开始做其中的某一件事,因为一旦开始,我都会花很大的心血去做好,会很费心。但人生苦短,能用心折腾的事还多?
快感:一种想到就会小抽搐,跌宕起伏的兴奋
老罗在发布会上,提起了快感,我很认可。曾经看过国外的新闻,一小哥提起,专研出某种技术的快感,胜过和女朋友的相处。
说下自己的故事。
故事四:最近上线的数据产品,让我充满了快感
几年前,领导打趣私下问每个新人,工作这块,你有什么规划?类似的答案从别人口中说出,资深hadoop运维工程师,架构师,数据仓库大牛,等等。那时候,我回答了,我想做一款数据产品,结果可想而知,真被笑了,不切合实际。(却没人知道,我当初为了面试数据产品经理,整整准备了两大页自己的构思和知识点整合。)
前些日子,由于个人发展,我跳槽了,面试过程中,还是有人问起我职业规划。我认为,会有人相信我了,所以我说了自己这几年做了很多准备,就是想在以后成为数据产品经理,做一款有自己色彩的大数据产品。结果出乎意料,都一一被质疑,以及婉绝了。…,不过后面我变聪明了,再被问,我改口说成资深数据挖掘大牛,沉醉于技术海洋里。听者兴奋,说者无心。
很幸运,来公司这段时间里,虽然时间不长,但是充实无比。花了3个多月的时间,真正切切有属于自己特色的数据产品能够落地(互联网金融行业,涉及羊毛党反欺诈监控的数据产品)。从无到有,从需求的调研和分析、系统功能的规划和确定,前后端功能的开发、推动和联调。到现在,5个页面菜单,4个子系统引擎,第一个阶段的功能点算是完成了,大数据挖掘与数据产品的融合。
这个一直以来的梦,开始尝到了点味道,你说兴奋?高兴惨了,工作起来就像个疯子一样,看起它,满满的爱意,就像看着自己的孩子不断茁壮成长。太有快感了,想起来都会抽搐下。
共鸣与傲娇:我们天生傲娇,却在渴望寻找着共鸣的声音
老罗在上一次发布会里,提到了傲娇,那种由心而然的底气真的很强烈,每一次看发布会直播的我,都能深深感受到。因为在大数据圈子里的我,也有这样的一面。就像锤子手机,从创办至今,虽然不怎么被看好,但却在每一次发布会时引起了全国、全世界的关注。
但我也能感受到老罗内心里的渴望,渴望共鸣的声音。即使声音很脆弱,很小,但却急切期待懂他的人能够共鸣,老罗也找到了这样一些共鸣。每一次听他发布会的锤粉们,因为懂他,也都会紧紧捏着一把汗。
回到大数据圈子里,每一个圈子里面的人,都是在做着改变未来世界的事,都有可能引领着大数据科技与生活的完美融合,不管是互联网+、生物医疗、基因工程、智能家居还是人工智能等等,太多新领域充满了太多未知,充满了太多使命感,所以我们真正天生傲娇,每个人都是自己的英雄。
可现在这个圈子并没有健康的茁壮生态,很多人从早就认为它就是一个泡沫,人人谈,人人吹,人人忽悠。就像法国的密西西比公司泡沫、英国的南海公司泡沫。当真正每个人都在吹捧它的时候,那说明大数据已经很危险了。
我很担心,未来的以后,大数据只是数据的积累和整合,一大堆框架性的东西,只是耗钱的东西,高空楼阁。并不是担心着失业,我只是觉得自己一路探索的“数学真正的价值”,仍然还是很难得到满意的答案。那种无助,也只能是弃甲归田罢了。
我说的这些,每一个数据圈的人,你们会有共鸣?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28