
技术牛逼也要懂点社交:数据科学家公司生存指南TOP30秘诀
数据科学家老司机的30个经验之谈,教你如何在公司内获得认同,带你绕过他们曾经踩过的坑。
作为一名数据科学家,即便你技术再牛逼,不懂职场社交也会成为你晋升之路上的天花板。
为此,我们创建了一份能够确保数据科学团队获得成功的秘诀top 30榜单。不管你的数据科学团队是新组建的,还是经验丰富的,这份榜单都很适用。作为数据科学家,我们希望把更多的时间用在分析问题上,而花更少的时间处理公司政治的问题。
在管理层与数据科学团队之间常有不和的情况下,我们该如何处理呢?处理不当会导致信任的缺失,项目执行不力和支持匮乏,进一步则会导致数据科学团队的失败。如果你觉得我们的top 30榜单有所遗漏,也欢迎补充。
1.获得管理层的认同
获得管理层的认同对任何项目来说都是最关键的因素之一。作为数据科学项目经理或数据科学家,努力让你的领导相信你的项目是你的职责所在。没有他们的认同和资金支持,你的项目是无法进行下去的。当你的老板发现你的数据科学项目有助于推动他的战略目标,他们会不遗余力地支持你的项目。
2.大胆一点,用数据告诉你的老板他们错了
经理和管理者也只是人类,他们一次只能处理那么多的信息,看到那么一些相关性。而你,作为一个数据科学家,可以利用你的专业知识和工具在相同时间内处理100倍的数据,精确地发现成千上万的相关性。使用这一知识,勇敢地向你的老板展示他们错了。不,但我们并不是让你得理不饶人。我们是让你支持你的老板。帮助TA,让TA带着正确的结论去参加会议。他们会为此感激你。不过,这就要求你指出他们的错误。
3.取得你同事的信任
根据我们与不同的团队合作的经验,我们发现很多领导甚至不相信他们的数据。然而,他们想要新的数据可视化模式,新的数据科学团队和新的一切。但如果你连你的数据都不相信,这些又有什么意义呢?福尔摩斯说过,数据是思考分析的基石。如果这是真的,而你又对自己的基石没有信心,那么你在此基础上所做的所有努力都终将土崩瓦解。所以,努力让你的领导和同事相信你和你的数据吧!
4. 从成功实现简单项目起步
我知道,所有人都希望开发下一个Google或Facebook算法。谁不想呢?那多酷,多有影响力,而且每年还能赚取数不清的利润。不过,如果你的团队才刚刚起步,而你想要它获得成功,那就从小的项目起步吧。别担心,即使是简单的东西,只要做得好,也能给你的领导带来不可逾越的价值。一旦你取得了第一次胜利,你的领导们就会在所有事情上寻求你的帮助。接下来你只要确保你的项目能够不断地接到各种任务,或者至少你做的项目都有用处。
5. 展现你的项目的价值
取得管理层认可的一种方法是成为一个推销员。怎么做?告诉他们为什么他们需要这个项目,创造这样的需求。数据科学仍是一门新兴科学,许多管理者还不知道他们为什么需要数据科学,以及在什么地方可以使用它。那就推销给他们看!这是你的职责!向他们展示如何使用数据科学以及将它转化为节约下来的资金、资源等等。
6. 将你的数据科学过程标准化
数据科学有许多需要特别洞察力的很酷的技术和工具。然而,就像软件工程一样,即使你可以做到所有那些很酷的事情,如果没有过程,你会跟不上项目,做出来的产品表现也不好,并且不能维护已经完成的项目。这意味着你需要把你的过程写成文档。这看起来好像是在浪费时间,但等你的项目出现内部故障的时候你就知道记录过程有多重要了。所以确保你从一开始就有很棒的数据科学过程。
7. 不要把你的数据科学团队框住
不要用你的知识范围来限制你的数据科学团队。挑战你的团队,问问他们怎么想的,问问他们的建议,不要限制他们的发展。让他们知道你支持他们并且相信他们的能力。数据科学家都是十分聪明的人,他们只是需要知道你相信他们(就像小叮当一样)。
8. 计划、计划、计划…但是不要计划太多
如果要说我们从不同的经历和项目中学到了什么,那就是——你需要计划。这确保你不会超出范围,保证你对所有的数据源和要求有一个很好的掌握,还保证你能成功。不过,如今在商业中事物变化得很快,所以你不能花一年的时间去计划一个项目。当一个项目提上了日程,你就得赶紧去获得这个项目的具体要求 。只是别把所有时间都用来计划而从来不开发项目。
9. 和别的部门打好关系
每个企业都像是一个团队性运动。你的团队需要和会计处、财务处、运营部、销售部和其他所有部门一起工作。他们通常都有自己的数据仓库,而你需要那些数据。如果你够幸运的话,会有一个中心团队管理所有的数据库。不过即使确实有这样的一个中心团队,你依旧需要来自各个团队的专家。此外,所有这些团队可能都会想要对你的项目提出一些要求。所以,确保和他们好好相处。
10. 向尽可能多的行业专家(SME)学习
像我们在上一点中提到的,你会想要向不同部门的人学习尽可能多的专业知识。数据科学家不是药剂师或医生,也不是会计或财务经理。我们需要从对某一行业或领域了解最透彻的人那里获得一些洞见。当一个新项目开始时,列一份你所需要的数据和相关主题的清单,然后去请教那些行业专家。
11. 消除公司中的偏见
然而,即使你要去征求行业专家的建议,不要让他们的偏见阻碍新的洞见。这种情况一直都在发生。很多时候管理层和其他团队成员对商业模式有固有或者过时的认知,他们会认为提升业务无非是那几个要素。接着,你的团队得出了一个全新的结论。由于这一结论与现状相违背,你的团队把这一新的洞见掩藏了起来,而没有把它提交给经理。这不是你作为一个数据科学家的工作。你的职责是挑战现状!不过是在正确的前提下。
12. 挑战现状!
作为一个数据科学家,你有数据站在你旁边支持你。这就意味着当你是对的,那你确确实实就是对的。你对的时候也不能得理不饶人。我们的意思是你要敢于说出真相,不要被你的经理或主管牵着鼻子走。 其实,他们想要你的意见。你的领导想要你提供给他们能够自信地带去见他们的老板的信息。归根结底,你的老板也有自己的老板。当他们向自己的老板汇报的时候,他们的感受和你的一模一样。所以,用数据巧妙地去挑战你老板的观点吧!
13. 利用数据驱动你的项目
我们相信现在你已经看到了一个主题。利用数据!这其中蕴藏了太多的力量。这甚至不是一个新的想法。人们一直都在使用数据证明一些事情。科学就是依赖于重复利用数据证明理论的这一套方法论,即使是那些我们今天认为是正确的理论。对你的每个项目也做同样的事情。你为什么做这个项目?是什么在驱动着它?最好是数据。
14. 首先建立一个原型以获得早期认同
你如何才能获得早期的认同?构建一个原始模型(当然,用python)。向你的团队和领导展示它能做什么。人们想要的是行动,而不仅仅是理论和言语。构建一个原始模型,如果可以的话,获得真实的数据输入进去。如果做不到的话就给它提供一些其他数据,但是要确保它的功能性还是存在的。让这一原型足够灵活、具有交互性和实用性。
15. 设计要有稳健性和可维护性
这点非常重要。不论建立什么仪表板,设定什么过程,或者开发什么算法,都要确保它是可持续的 。如果你明天离职,项目还能正常运转吗?你的同事们会不会背后骂你?说真的,如果你一点记录都没留下,从没分享过你的代码,那你在老同事中就会留下差评。
16.把无聊的工作自动化
停止无聊的手动处理数据再加工和品质监控。快快停止。在刚开始设计系统的时候,确保把尽可能多的无聊基础工作自动化。不要担心,你的公司永远有做不完的数据科学项目。让计算机自动完成而不是一周花费两个小时来上传数据会让你感觉更好。
17.获取外部数据科学指导
有很多数据科学咨询公司可以给你的团队提供数据科学指导。他们通过获知你的团队现在的状态,并和团队一起工作来了解如何提高工作效率。这点经常被很多团队忽略了,所以引入外部帮助是很有用的。
18.写自己的数据科学指南
或许你的团队里面有个超赞的数据科学家,不仅能完成自己的工作,也能给你的团队写很好用的工作手册,其中包括上载、程序示例、系统文档等等。如果是这样,让他们放手来做。相信我们,没有比亲自到岗和获得系统文档更有帮助的了。你可以知道之前发生了什么,建立新的解决方法并且快速的解决问题。这可以给你的公司省钱,也让数据科学顾问感到开心。
19.在项目开始前,学习创造性的收集和分类数据
你知道什么是坏主意吗?让20个分析师用一个月分类50000个数据点。这时对资源和资金的巨大浪费。当你开始一个项目时,试着开发一个不需要分析师的数据分类器。可以试着进行众包,提供服务器,设计新产品,尝试任何可以实现收集并分类数据的办法。但要尝试避免你的团队陷入单调乏味的工作。
20. 首先建立系统来合理的收集数据
有时候,你会很幸运的参与首创性的项目。采集系统将会在半年内为你采集分析所用数据。当你开始建立系统的时候,一定要未雨绸缪。考虑你需要哪些数据,希望它和哪些其他系统交互,等等。不要只建立一个功能系统,在事后才把数据采集组件添加进来。
同时,数据是从不同的数据源来的。可以从内部仓库、外部API或者任何其他地方获得。收集尽可能多的数据,确保数据处理过且干净。
21. 做一个会讲故事的人
说到底,我们都有老板,并且我们都需要说服老板我们是对的。作为一个数据科学家,你需要时常去做这件事。为什么,因为你要传达的基于数据观点可能非常枯燥。在跟你的上级汇报时,只要讲到百分比和标准差,你就能看出来他们已经走神。相反的,你应该建立一个信息图,一个PPT,一大堆干巴巴的数字之外的任何形象化展示。你希望引起大家的热情和共鸣。获得更多在第一点提到的。更多的管理层买账,代表着更多的资金和更多成功的可能性。
22.与管理者沟通数据科学在内部和外部的价值
数据科学有影响消费者和员工的能力。告诉你的上司数据科学如何工作以及它的价值。这一点将会在这份清单中不断重复。不论如何,从越多的角度告诉管理人员你的项目能够节省成本效果越好。数据科学家喜欢谈论具体算法,比如如何计算一个人在翻看facebook时抓鼻子的概率。但是,商业团队只关心他们能从那个信息中挣多少钱。否则那个信息有什么用?
23.学习管理流程
你的团队需要知道管理者如何工作。你的项目需要通过几道评审,他们多长时间见一次,他们希望看见什么?你对上级管理者如何工作知道的越多,就能越好的帮助把工作引入正规。并且,也会更加容易获得资金和让项目通过监督。
24.明白高管的策略和他们疑虑
高管有自己的政治生涯,自己的处理流程和策略。很多员工根本不知道背地里公司管理层发生着些什么。我们一直在努力争取让数据科学家和高管之间有更多开放的讨论,不只是一个而是一群高管。一旦你了解高层发生了什么,就能更容易的开始开发符合他们策略的项目和程式。
25. 能够跟上级解释你的失误
这世界失败常常发生,特别是在数据科学领域。确保你能向你的领导解释为什么失败,并且在需要时向他们请求帮助。不要只因为你被需要外部介入的问题卡住,而让项目半路搁浅。这会损失更多人的利益。
26. 必要时寻求外部介入
有时寻求外部介入是必要的。这包括雇佣咨询团队,或者新员工。有时项目会扩张或者有更多的项目被批准。雇一些临时员工来保证规定时间完成不是一件坏事。在一个能节省上百万的项目上花费一些成本是值得的。
27. 阅读足够多的外部新闻来获得灵感
太多的外部新闻可能会让人陷入混乱。它可能会引起对落后的担心,因为你的项目可能没能达到巨头的水平。不要担心,只要阅读足够的内容来启发你前进,而不用去读太多那些你觉得自己水平无法达到的文章。
28. 质疑你做的每一个项目
如果一个管理者提议你去做一个项目,尽管有其他副总裁或者高管的支持,也要对项目究根问底。为什么要做这个项目,它能在哪些地方起作用,它能节省多少成本?你可能是需要去发现这些问题答案的人,但是确保你知道问题的答案。不然,你可能做了一个毫无用处的项目。
29.积极面对
“积极面对”是一句鸡汤,同时也是真理。你很容易失去希望,特别是如果你是一个数据科学项目管理员。或许你的团队的发现没有太多价值,或许甚至没有任何发现。其实这样的情况很多见。不是每一个项目都会立刻成功。保持耐心和积极。如果你的数据是干净正确的,并且数据科学方法是可靠的,最终总会有成果产生。
30. 做一个决定,提出一个实际的观点
作为一个数据科学家,你有自己的力量。你有数据,这代表你可以充满信心的做出论断。不要忘记这点。请多多使用下面的语句:
最好的决定是……
我建议我们可以……
我知道……
让我们尝试方案x,因为……
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15