
有一个关于ML(机器学习)的炒作列车正在进行,许多初学者正成为这个炒作列车的受害者,因为他们是因为错误的原因进入的。你的教授会解释如何获得博士学位。如果你想变得更好,或者你的同行告诉你如何获得更好的GPU和IDE(集成开发环境),这是必要的。当您开始从在线课程中学习时,您意识到您需要更大的数据集和对Python的熟练程度。在你申请工作时学习了所需的技能后,你意识到你需要的不仅仅是几门课程或证书。最终,在得到这份工作后,你意识到这是一项要求很高的工作,有时这些工作在最初阶段的报酬并不高。
本文将帮助您度过这些失望,并为您准备好面对这些问题。我们将学习很多关于初学者进入机器学习领域所面临的现实问题。
有明确的经验证据表明,您不需要大量数学,不需要大量数据,也不需要大量昂贵的计算机。-Jeremy Howard(面向程序员的实用深度学习)
是的,如果你进入ML领域,尤其是深度学习,编码是必要的。这并不意味着您先花时间学习Python、C++或R,然后才开始学习ML。当你学习基础知识时,编码部分会自然而然地出现。您不需要记住语法或模型架构,可以从简单的google搜索中搜索它们。就这么简单。世界正在走向无代码机器学习和AutoML。AutoML是一个强大的工具,它将为您执行所有的任务,并为您提供一个工作的机器学习模型。有时你只需要写两行代码而不是两百行代码就能得到类似的结果。
是的,你需要一些数学,但为了研究和推进深度学习的边界。如果您要训练您的模型并将它们部署到生产中,那么您可能需要学习MLOps,而不是数学。
应用机器学习不需要数学,但对于任何研究和突破边界,你需要学习高级统计学。-Jakubéitní
您还需要学习模型体系结构是如何工作的,以及各种矩阵函数。这些可以在8小时的课程中教授,有时您甚至不需要学习解决问题所需的所有模型架构。我是Jeremy的超级粉丝,在他用Fastai和PyTorch为程序员编写的bookDeep Learning中,他解释说在深度学习领域有很多守门人。学者们会要求你学习高级微积分,学习所有的数学模型,最终获得博士学位。在一个特定的领域使它。但你不需要这些。我见过很多没有学位、有商业背景的人现在都是领域里的专家。所以,请专注于基础知识,学习整个课程,并通过投资组合项目开始成长。
是的,但在少数情况下。现代的深度学习模型现在能够在有限的样本数下产生高精度。随着像Kaggle这样的平台的引入,甚至获取数据集现在也变得更加容易了,Kaggle有数千个开源数据集可供下载和用于商业目的。我们还可以在GitHub、DAGsHub、HuggingFace、Knoema和Google Dataset Searchch上找到数据集来训练我们的模型,并最终将其用于生产。
有些工作确实需要机器学习学位或TensorFlow证书,但如果你在GitHub和Kaggle上有强大的投资组合,这些事情就变得次要了。许多开发人员正在向机器学习过渡,他们没有专门的学位或证书来证明,但他们确实有使用深度学习模型并将其部署到生产中的经验。如果你能以某种方式向雇主证明你可以完成机器学习生命周期中的每一项任务,那么你就是完美的候选人。总的来说,如果你有一个强大的机器学习组合,就不应该在你的脑海中获得证书或学位。要获得强大的ML投资组合,请阅读:如何作为初学者构建强大的数据科学投资组合-KDnuggets。
不,我有一台旧笔记本电脑,我可以借助Kaggle平台在云GPU和TPU上训练这些庞大的模型。世界正在从个人电脑走向云电脑。您可以从Kaggle和Google Colab获得免费的CPU、GPU和TPU。还有其他平台也可以帮助您进行数据分析和创建完整的项目,如DeepNote、JetBrains Datalore和PaperSpace。这些平台为您提供了一个免费的工作空间,通过添加协作工具来构建您的机器学习产品。在我的日常工作中,我使用Deepnote进行新的研究或项目,如果我需要更好的GPU或TPU,我会切换到Kaggle Orcolab。
您不需要购买昂贵的IDE或计算来构建您的产品。现在您有了这些免费的云工具。
在获得所需的技能后,你开始在市场上找工作,但很快你就意识到公司需要更多。他们希望你了解数据工程、数据分析和MLOPS。在面试阶段,他们会询问你最近的项目和你部署模型的工作经验。
即使在学习了关键的必要技能后,你也会感到相当失望。这是因为大多数公司都在寻找有经验的个人或拥有多种技能的人。你提高机会的唯一方法就是不断学习一项新技能,不断参加机器学习比赛。这也将改善您的ML投资组合,并最终使您脱颖而出。如果你刚开始工作,很难找到工作。继续努力,最终,你会得到你梦寐以求的工作。
正如我上面提到的,它需要擅长各种技能:显然,一个优秀的机器学习工程师所需要的一切,比如好奇心、分析技能、算法知识、理解业务需求的能力,以及有效沟通的需求。还有更多。你需要善于构建需要机器学习操作经验的软件解决方案。Shanif Dhanani的机器学习工程师生活中的一天
除此之外,有时还必须执行迭代任务,如标记数据集。你可能找不到一份高薪的工作,但你最终会得到一份需要你全职和专注的工作。如果你进入这个领域只是因为它提供了一份高薪的工作,那么你应该开始考虑其他的选择。你在职业生涯中取得成功的唯一途径是对人工智能技术有坚定的热爱。
最后,我会一直建议你继续学习新的技能,开始参加Kaggle比赛。为了你的职业生涯,继续寻找新的工作,为你的技术面试做好准备。我只想向你们展示这个领域的实际情况。这并不漂亮,也不是每个人都能度过难关。只有努力工作和学习的心态,你才能找到一个舒适的职位,你有一个高薪的工作。
我们还讨论了机器学习如何不需要大量的数学、专业学位或博士学位。它不需要大量的计算能力或庞大的数据集。它只需要你的时间和努力工作。你可以在网上找到令人惊讶的课程,在学习了一些技能后,开始将这些技能应用到你的投资组合项目中。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10