京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据猿们,是时候想想这几个问题了
其实这篇文章我很久前我就想写出来了,只是一直没有时间,直到昨天,一个人再次触动了我的神经。
事情过程是这样滴,昨天技术群里有人贴了张图,然后提问:
为什么我的storm命令执行不了?
然后有群友回了句:
permission denied,访问拒绝了。
然后,这哥们又问道:
为什么访问被拒绝了?
然后接下来,有群友跳出来,手把手的教他怎么+x附权限。然后这哥们又来事了:
为什么我storm提交命令还是出错?
然后有好心群友提了句:
你提交任务命令缺少了两个参数。
然后哥们继续:
缺少了什么哪两个参数?
然后我实在忍无可忍了:
再次建议百度一下,这种问题,随便查一下就有了。问问题之前,建议先自己动手解决,解决不了再试着从其他途径获取。这是一种好的获取知识的习惯,如果你习惯了一有问题就问,你慢慢的就失去了学习能力。
如上就是我的原话,事情的过程也就这样子的。同时,这也就是我想表达的第一个观点。
01 猿/媛们,别让自己失去学习的能力!
这种事情在技术群中属于半常态化的事,但我依然对此表示大大的不赞同。其实,类似这种问题,简单的百度甚至用不上谷歌,就能搞定。
或许有人会反驳了,问这种问题的大多都是新手,对于新手我们要宽容。
对此,我的意见是相反的:对于任何新手来说,掌握解决问题的方法尤其重要,而问题的答案个人认为恰巧是次要的。
遇到一个问题,问别人是最快的方式,但是,如果下一次你的问题没人会呢?所以,我们需要学会自己去解决问题,最简单的路子:先百度,百度找不到,找谷歌。
要相信一个事情:你所遇到的问题,百分之九十八以上别人都遇到过,然后这百分之九十八中又有百分之九十八在互联网上都能找到。
或许你在查找答案以及尝试解决的时候,并不是那么的顺利,但是,其中的一些收获是你直接从他人那里获取答案得不到的。
我们需要的是:一种遇到问题时解决问题的思维逻辑,养成良好的解决问题习惯。这样,才有长足的进步,而不是一直停留在,一有问题就想到问人,一没有人回答就两眼发白,脑袋空空。并且,不断的尝试,不断的实践,才有更多的进步!
02 求助是一种心态,学会尊重!
上面说到了请教问题,那么现在我们来说一下请教他人问题的话题。
先说一个场景,想必很多人遇到过,在技术群中:
某男:小弟初来乍到,请教一个问题,XXXXXX...
...(若干秒内,没人回答)
某男:没人回答吗?这不是XX技术群吗?问个这么简单的问题都没有人回答,真是垃圾群!
然后,某男在一分钟内完成了加群,入群,问问题,然后表达他的脏字功底,然后退群的整个过程。
作为一个2000人大群的群主,我遇到无数次这种情况了。当然,很多情节并没有这么严重,很多了不起等不到人回答,最多冷嘲热讽几句。
通常这种情况下,我会进行调节,并且传播如下“邪恶”思想:
首先,我们作为寻求他人帮助的一方,需要明白两点:第一、技术群里(当然,其他社区啥的都一样)的其他人并没有欠你钱;第二、你并没有给任何人咨询费。
所以,没有人帮助你是正常现象,有人帮助你,你是得感激的!
以上想法不单纯适用于程序猿这块,其实对任何相似场景都是适用的。
我们在寻求帮助时需要保持一种和平的心态,没人及时回答并不代表别人不知道,也不代表不愿意帮助,每个人都有自己的活要干,毕竟他得为自己得工资负责,或许他们只是没有时间,所以为何不能耐心的等一等呢?
换句话说,哪怕是真是没人愿意回答你,哪别人也依然不欠你什么,你也没有损伤什么。出口成脏只能降低你的格调,而不会额外的带来什么其他收获。
如果有好心人给了你答案,给了你提示,别忘了说声“谢谢”,说小了,这是一种良好的习惯,说大了,是你格调的提升!同时,这也是自身的一种待人处事的修养。
03 学会交流与分享!
说这个话题之前,我们来先看一张图。
学习金字塔
这张图,是我偶然看到的,相信很多都见过。看到之后感觉很契合我的一些观点,所以就直接拿过来用了。
我曾和好几个人讨论过类似的问题,记得,组织第一期“米特吧大数据技术沙龙”的时候,跟提供场地的创业公司老大聊过这个话题。他说,良好的交流氛围是建立在双方具有同等水平的前提下进行的。
对于这点,我深表赞同,不过个人的意思并不是说一定要两者拥有完全学识,但是最起码交流时要有自己的见解,又自己的思想火花,话语是经过自己思考说出来的。
还是以技术分享交流活动为例,并不是说每个人都上去分享,但是对于某个话题,每个人都必须有自己的见解,有疑惑,有讨论,这才是良性的技术氛围。而不至于只是为了听而听,如果是这样,那就没有意义了。
我们再回到刚才上面这张图就知道了,技术交流的是建立在自己对某个话题深思熟虑,或者有自己的见解基础上进行的,这样才会有更大的收获。
每个人都能从对方的观点中获取到一定的东西,其乐融融!
而在交流之后,进行自己的实践,累积到一定的程度,进行分享出来,再与他人讨论你的收获,形成一个良性的循环。
说到这里,其实我们这节的主题就忽然欲出了:如何建立起良好的技术交流氛围?首先,自己得有充分的思考,提出来的问题也好、建议也好,才有深度,然后才有各抒己见的讨论;然后从他人的见解中获得进步(结合自己的思考,当然,他人也同样);在整理之后,再分享出来(这是你听N次啥流弊XX大会都收获不来的)!
这是一个良性的循环过程,提倡有深度的交流,提倡收获之后的分享,这一直是我心目中的完美技术圈子!这也是为何我一直坚持“进步始于交流,收获源于分享”的原因所在!
04 今天你看书了吗?
看书是一个良好的习惯,这点毋庸置疑。
特别对于从事大数据方向的朋友来说,尤其重要。这是为何呢?
首先,正如我上一篇文章《你们是不是很缺大数据工程师?》所说,这个领域在国内的积累其实并不算太多,也就意味着我们需要花费比较多的时间去积累这方面的知识。而看书是一种快速积累知识的方式。
此外,大数据领域也是一个技术快速迭代的技术领域,每一年都会涌现很多新的技术,很多新的框架,哪怕是用不上,但是,很多依然是可以参考的。所以,如果需要跟上这个节奏,我们同样也需要及时的吸取书中的新东西。
看书也是一种自我提升的方式,所以,除了本质工作涉及的一些知识以外,我们完全可以扩大书籍的范围,横向扩展自己的认知。
关于看书的方式以及时间,我的建议是:尽量的碎片化。
如果让你放下所有的事,专门花费一两个小时去读一本书。我相信大部分人都会按耐不住的,所以,我们可以抓住一些碎片时间,比如敲代码敲累了,比如等电梯、等地铁。
书中有没有颜如玉不知道,但书中一定是有黄金屋的(比如你跳槽时,能跟面试官侃天侃地,然后拿到offer钞票哗哗的来,想想就鸡冻)!
05 总结
以上几点就是我想表达的一些东西了。总体来说,其实不止大数据程序猿,其他搞IT的盆友也是一样的。往深处说,不止搞挨踢的,其他人也是一样的。
很多时候,这是做事的一个方法,处事的一种态度!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15