
数据分析师的情怀,一个大数据工作者的感悟
1、大数据圈子里的毛病
从我接触大数据到现在,我看到了它的兴起,国家政策的大力倡导,以及未来的潜在趋势。但说心里话,我感觉不温不火——像极了便秘,看似吃奶的劲,却半天蹦不出个屁来。而且有些方面朝着一种病态的方向发展,我是挺担忧的,不知道你们了?
一直以来,我都是在接触数据产品相关的事,至始至终,国内真正领悟大数据产品精髓核心的人不多,拿出手有价值的数据产品更是屈指可数(今天也不是谈数据产品的)。难道大数据的价值在一款跨时代的数据产品身上这么难体现?
很纳闷,观察了很久。归根到底,关键性因素是“数据情怀”惹得祸。为什么这样说,很多身处在大数据领域的人,很缺乏真正意义上的那一股劲——“数据情怀”,去推动着这个行业的真正成长,不管是做培训也好,做产品也好,传道授业也好。而这股劲,直接影响你在为这个领域的蓬勃发展,不吹嘘,真才实干,贡献多大的力量罢了。
2、数据分析师的情怀是什么?
谈到这里,不免而然的又需要聊下,我理解中,数据情怀都体现在哪些?概括起来,以下几个词:
初心 | 使命感 | 快感 |共鸣与傲娇
这并不是鸡汤那一套,这只是我本人对待大数据的一种态度,分享而已,寻找共鸣。分别举几个故事吧。
初心:不忘初心,方得始终
谈起当初为什么会选择大数据领域,我也才是一个学通信的人而已!
最近,有位朋友在分答上向我提过这样类似的问题,原话是:你是如何赶上机遇选择这个领域的?是热爱,还是仅仅偶然?(我没回答这个问题,打算今天一起聊了)
我很理解这个提问的出发点,因为我知道现在大数据圈子里,有这样一个现象:
很大一群准大数据人,还正在培训班里或者自己学习着。
一部分转型做数据开发的大数据人,工作年限在5年左右及以上,更多是从Java开发转行过来做大数据框架这套东西的,真正接触大数据时间也就在2年之内。
这样的转型,除了职业规划,也包含着薪酬水平。如果真正纯正的,应该也是在2012年靠后,就开始接触大数据的这一群人,不过很少,很幸运自己就算是一个。
故事一:我与数学的藕断丝连
我的确是学通信的,我也压根没打算学数学专业。可我从小到大数学都很厉害啊,很多时候都是分最高的(太老套路了,数学好的人多去了)。自己一路以来,转变过很多方向,但都是在寻找一个答案(学数学的意义)。
大学以前,数学一直不错,很多时候都是最高分,上了大学后,还曾经为了哥德巴赫猜想熬夜专研过,十分兴奋,当然也没这么容易被我证明出来。但后来想明白了,觉得数学这一套公式的计算、求证和推导,压根不是我感兴趣,想探索的,直接拉倒。
后面在大学,有机会接触到数学建模,顷刻间觉得它是应用数学在实践中的真正应用,是一种知识的融合和思考问题的突破,结果也是获奖无数。总共参加11次比赛,一次去深圳参加夏令营遗憾获得了三等奖(全国很多高校,包括清华、复旦等,百度可搜到我回答问题的照片,被选着成为新闻素材),最后一次无心参加的美国建模二等奖,剩余都是一等奖(其中也包括全国大学生数学建模一等奖)。这里并不是晒优秀,太老套路了,能获好成绩的人多去了。后来想明白了,觉得以比赛性质存在的这应用数学,花几天时间交上去的论文,都是狗屁不通,全是忽悠和抄袭,还是没找到数学真正价值的存在。
这时,大数据来了,我觉得大数据或许能够找到数学,乃至数据真正的意义,这的确是我喜欢瞎折腾的一个初心——我太想在自己身上找到数学存在的意义了,所以当时第一个想法是,玩转数学。刚开始总是围绕数据源打转,做一些类似阿里指数那样的大数据报表,总想把各种大数据生态圈底层的开发技术都了解遍,费力不讨好,压根也没有体现出大数据真正的价值在何处?
后面,在从事大数据领域过程中,也又转变了一些方向,有幸多次参加与一家美妆公司老板,甚至是一些高层的调研,花了一个多月的时间,慢慢领悟到业务真正需要数据为它做什么?业务方需要什么样的数据产品?数据真正的价值,原来潜力很大,只是还少有人去探索成功罢了。
这是自己目前做的事,又找到折腾的事,至少我这一路的初心,都是在寻找数学,乃至数据的价值。并不是每个从事大数据圈子里的人,都必须要像我这样折腾,但至少你需要思考一下,当初选择进入这个圈子的初心,是有执着?还是追潮流罢了?
使命感:人这一辈子,能折腾的事不多,用心做好每一件事
故事二:我微信朋友圈,一些活跃的,有典型的数据人有特别专注智能金融的捷哥,一个从国外回来创业,想在互联网金融这个行业探索数据价值的人群。有天天吟诗作乐,深深陶醉在大数据情怀的高总,一方面也顾着大数据人才思维培养的重任。
有自由职业,但却天天飞这飞那培训的黄老师,一直重视着业务与数据紧密结合,推广着自己写的书(@数据化管理:这好像是说我)。
有想在目前培训行业,做出一番贡献,一直默默筹备着机会的老李,充满了情怀,利志于打破目前大数据培训的混乱。
…
数据圈子里,有着这样的一些人,我不熟悉的,还会有一些这样的人。他们感觉自己充满了使命感,傻傻的,即使迷途惆怅,也坚信光明就在远方。我喜欢这样的一群人,只是在数据圈子里面,太少太少了。
故事三:一些无心,大忽悠,特立独行的数据人
踏入大数据圈子,也仅仅是为了转型,为了薪酬,为了养老,我并不想真正做出点啥。
躺到一定年限,慢慢也具备一定的忽悠资本,酷爱说一些很潮流的大数据技术,但做起大数据的事,很难产。
拥有一定专业技能,但总在小圈子里钻,认为不断学技术,才是存在感。却不知技术本身的真正意义和价值,难应用于业务。
我这样一个人,对于规划过的产品,写过的文章,做过的培训,我十分重视,觉得它代表我的态度和使命感。特别怕开始做其中的某一件事,因为一旦开始,我都会花很大的心血去做好,会很费心。但人生苦短,能用心折腾的事还多?
快感:一种想到就会小抽搐,跌宕起伏的兴奋
老罗在发布会上,提起了快感,我很认可。曾经看过国外的新闻,一小哥提起,专研出某种技术的快感,胜过和女朋友的相处。
说下自己的故事。
故事四:最近上线的数据产品,让我充满了快感
几年前,领导打趣私下问每个新人,工作这块,你有什么规划?类似的答案从别人口中说出,资深hadoop运维工程师,架构师,数据仓库大牛,等等。那时候,我回答了,我想做一款数据产品,结果可想而知,真被笑了,不切合实际。(却没人知道,我当初为了面试数据产品经理,整整准备了两大页自己的构思和知识点整合。)
前些日子,由于个人发展,我跳槽了,面试过程中,还是有人问起我职业规划。我认为,会有人相信我了,所以我说了自己这几年做了很多准备,就是想在以后成为数据产品经理,做一款有自己色彩的大数据产品。结果出乎意料,都一一被质疑,以及婉绝了。…,不过后面我变聪明了,再被问,我改口说成资深数据挖掘大牛,沉醉于技术海洋里。听者兴奋,说者无心。
很幸运,来公司这段时间里,虽然时间不长,但是充实无比。花了3个多月的时间,真正切切有属于自己特色的数据产品能够落地(互联网金融行业,涉及羊毛党反欺诈监控的数据产品)。从无到有,从需求的调研和分析、系统功能的规划和确定,前后端功能的开发、推动和联调。到现在,5个页面菜单,4个子系统引擎,第一个阶段的功能点算是完成了,大数据挖掘与数据产品的融合。
这个一直以来的梦,开始尝到了点味道,你说兴奋?高兴惨了,工作起来就像个疯子一样,看起它,满满的爱意,就像看着自己的孩子不断茁壮成长。太有快感了,想起来都会抽搐下。
共鸣与傲娇:我们天生傲娇,却在渴望寻找着共鸣的声音
老罗在上一次发布会里,提到了傲娇,那种由心而然的底气真的很强烈,每一次看发布会直播的我,都能深深感受到。因为在大数据圈子里的我,也有这样的一面。就像锤子手机,从创办至今,虽然不怎么被看好,但却在每一次发布会时引起了全国、全世界的关注。
但我也能感受到老罗内心里的渴望,渴望共鸣的声音。即使声音很脆弱,很小,但却急切期待懂他的人能够共鸣,老罗也找到了这样一些共鸣。每一次听他发布会的锤粉们,因为懂他,也都会紧紧捏着一把汗。
回到大数据圈子里,每一个圈子里面的人,都是在做着改变未来世界的事,都有可能引领着大数据科技与生活的完美融合,不管是互联网+、生物医疗、基因工程、智能家居还是人工智能等等,太多新领域充满了太多未知,充满了太多使命感,所以我们真正天生傲娇,每个人都是自己的英雄。
可现在这个圈子并没有健康的茁壮生态,很多人从早就认为它就是一个泡沫,人人谈,人人吹,人人忽悠。就像法国的密西西比公司泡沫、英国的南海公司泡沫。当真正每个人都在吹捧它的时候,那说明大数据已经很危险了。
我很担心,未来的以后,大数据只是数据的积累和整合,一大堆框架性的东西,只是耗钱的东西,高空楼阁。并不是担心着失业,我只是觉得自己一路探索的“数学真正的价值”,仍然还是很难得到满意的答案。那种无助,也只能是弃甲归田罢了。
我说的这些,每一个数据圈的人,你们会有共鸣?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01