
当我第一次申请l时,我想同时成为一名自由职业者和一名“真正的ML工程师”。
在此之前,我在Nordeus担任机器学习工程师,Nordeus是一家顶级移动游戏公司,以其旗舰游戏TopEleven上有穆里尼奥的脸而闻名。我在Nordeus的机器学习经历包括设计和实现一个智能系统,以帮助客户支持团队更快地解决玩家问题。它的本质是从大量的历史球员门票和代理决议中构建一个文本分类器。
我考虑了整个系统,数据(至少我是这么想的),以及对GPU的访问。从纸面上看,一切似乎都对我来说刚刚好,可以展示一个伟大的模型和一个更好的解决方案。
但这从未发生过。令我绝望的是,我花了一个多月的时间才意识到,我试图用来训练我的监督模型的数据集已经非常糟糕了。在意识到这一点之前,我花了数不清的时间和Jupyter笔记本试图让整个事情运转起来。我工作太忙了,抽不出时间看资料。我们可以说我缺乏经验没有帮助。
在这个失败的项目三个月后,我决定辞去工作,在Toptal开始我的自由职业之路。经过几轮面试和技术筛选,我进入了最后一轮。猜猜看?我得解决一个机器学习作业。几乎和我以前失败的那个一模一样。我有一周的时间来完成它。
很难描述那一周我不得不与之作斗争的消极自我谈话的数量。冒名顶替综合症的长长的阴影迷惑了我的头脑。
这一章有一个圆满的结局。我很好地解决了这个问题,我进入了托普塔尔。三年10个项目后,我可以说我处理冒名顶替综合症好多了。
勇敢是对你帮助最大的事情。自由职业者是勇敢的。如果你想了解更多,请查看我以前关于如何成为自由数据科学家的文章。
当你作为自由职业者/承包商工作时,来自你工作的反馈不会出现在季度或年度审查中。它每天都来。没有办法破解。客户期望您提供质量和快速。顺便说一句,这就是为什么你会比在目前的工作中得到更好的报酬的主要原因。
一旦你觉得你已经掌握了ML的基本原理,就把自己放在拳击台上。考验你自己。你很聪明,你能做到。参加更多的在线课程并不能让冒名顶替综合症消失。相信我.
IMHO排名前2的自由职业平台是
由于数据(大写字母,是的),ML工程比传统软件工程更难。
很少有机会给你一套完整的特性和标签来构建你的ML模型。相反,您通常需要自己生成训练数据。在这个意义上,我遇到的最常见的问题是:
数据是推动所有模型的神奇成分,从简单的线性回归到巨大的变压器模型。如果燃料不好,你开哪辆车都无关紧要。你不打算搬家。
这听起来如此琐碎和愚蠢,以至于我们(我包括我自己)ML工程师有一种令人惊讶的忘记的倾向。当您获得更多构建ML解决方案的经验时,您会更好地记住这一点,并在遇到问题时返回数据。
不能使用Stackoverflow调试数据集。你一个人在那里。你需要改变你的心态。你必须表现得像个解决问题的人。您需要了解数据集,最好的方法是将其可视化。我个人喜欢Tableau Desktop,但也有其他选择,如Power BI、Apache Superset等。如果您愿意,甚至还有Python库,如SweetViz。
无论您喜欢哪种工具,每次卡住时都要返回数据。
机器学习是一个涵盖广泛技术复杂性的领域:软件开发、操作化(MLOps)、经典ML、深度学习的前沿研究、硬件优化…
如果你试图掩盖一切,你会失去焦点,在表面上游荡太多。了解ML中的某些内容意味着您已经自己实现了它。句号。
例如,跟上DL的最新进展是非常棒的。但要有原则地去做。为自己设定一个明确的目标(例如,我想成为变压器模型的专家),并为自己建立一条通往该目标的道路,选择相关的论文、图书馆、网络研讨会,甚至会议。
从一个话题跳到另一个话题让你很忙但注意力不集中。保持谦逊。从小处着手,集中精力。一旦你到达那里,迈出下一步,征服另一个领域。
克服你的恐惧是每天(全职)的工作。不仅仅是在机器学习中,而是在你生活的每个方面,在这些方面你希望明天成长和变得更好。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28ALTER TABLE ADD 多个 INDEX:数据库批量索引优化的高效实践 在数据库运维与性能优化中,索引是提升查询效率的核心手段。当业务 ...
2025-08-27Power BI 去重函数:数据清洗与精准分析的核心工具 在企业数据分析流程中,数据质量直接决定分析结果的可靠性。Power BI 作为主 ...
2025-08-27CDA 数据分析师:数据探索与统计分析的实践与价值 在数字化浪潮席卷各行业的当下,数据已成为企业核心资产,而 CDA(Certif ...
2025-08-27t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22