京公网安备 11010802034615号
经营许可证编号:京B2-20210330
有一个关于ML(机器学习)的炒作列车正在进行,许多初学者正成为这个炒作列车的受害者,因为他们是因为错误的原因进入的。你的教授会解释如何获得博士学位。如果你想变得更好,或者你的同行告诉你如何获得更好的GPU和IDE(集成开发环境),这是必要的。当您开始从在线课程中学习时,您意识到您需要更大的数据集和对Python的熟练程度。在你申请工作时学习了所需的技能后,你意识到你需要的不仅仅是几门课程或证书。最终,在得到这份工作后,你意识到这是一项要求很高的工作,有时这些工作在最初阶段的报酬并不高。
本文将帮助您度过这些失望,并为您准备好面对这些问题。我们将学习很多关于初学者进入机器学习领域所面临的现实问题。
有明确的经验证据表明,您不需要大量数学,不需要大量数据,也不需要大量昂贵的计算机。-Jeremy Howard(面向程序员的实用深度学习)
是的,如果你进入ML领域,尤其是深度学习,编码是必要的。这并不意味着您先花时间学习Python、C++或R,然后才开始学习ML。当你学习基础知识时,编码部分会自然而然地出现。您不需要记住语法或模型架构,可以从简单的google搜索中搜索它们。就这么简单。世界正在走向无代码机器学习和AutoML。AutoML是一个强大的工具,它将为您执行所有的任务,并为您提供一个工作的机器学习模型。有时你只需要写两行代码而不是两百行代码就能得到类似的结果。
是的,你需要一些数学,但为了研究和推进深度学习的边界。如果您要训练您的模型并将它们部署到生产中,那么您可能需要学习MLOps,而不是数学。
应用机器学习不需要数学,但对于任何研究和突破边界,你需要学习高级统计学。-Jakubéitní
您还需要学习模型体系结构是如何工作的,以及各种矩阵函数。这些可以在8小时的课程中教授,有时您甚至不需要学习解决问题所需的所有模型架构。我是Jeremy的超级粉丝,在他用Fastai和PyTorch为程序员编写的bookDeep Learning中,他解释说在深度学习领域有很多守门人。学者们会要求你学习高级微积分,学习所有的数学模型,最终获得博士学位。在一个特定的领域使它。但你不需要这些。我见过很多没有学位、有商业背景的人现在都是领域里的专家。所以,请专注于基础知识,学习整个课程,并通过投资组合项目开始成长。
是的,但在少数情况下。现代的深度学习模型现在能够在有限的样本数下产生高精度。随着像Kaggle这样的平台的引入,甚至获取数据集现在也变得更加容易了,Kaggle有数千个开源数据集可供下载和用于商业目的。我们还可以在GitHub、DAGsHub、HuggingFace、Knoema和Google Dataset Searchch上找到数据集来训练我们的模型,并最终将其用于生产。
有些工作确实需要机器学习学位或TensorFlow证书,但如果你在GitHub和Kaggle上有强大的投资组合,这些事情就变得次要了。许多开发人员正在向机器学习过渡,他们没有专门的学位或证书来证明,但他们确实有使用深度学习模型并将其部署到生产中的经验。如果你能以某种方式向雇主证明你可以完成机器学习生命周期中的每一项任务,那么你就是完美的候选人。总的来说,如果你有一个强大的机器学习组合,就不应该在你的脑海中获得证书或学位。要获得强大的ML投资组合,请阅读:如何作为初学者构建强大的数据科学投资组合-KDnuggets。
不,我有一台旧笔记本电脑,我可以借助Kaggle平台在云GPU和TPU上训练这些庞大的模型。世界正在从个人电脑走向云电脑。您可以从Kaggle和Google Colab获得免费的CPU、GPU和TPU。还有其他平台也可以帮助您进行数据分析和创建完整的项目,如DeepNote、JetBrains Datalore和PaperSpace。这些平台为您提供了一个免费的工作空间,通过添加协作工具来构建您的机器学习产品。在我的日常工作中,我使用Deepnote进行新的研究或项目,如果我需要更好的GPU或TPU,我会切换到Kaggle Orcolab。
您不需要购买昂贵的IDE或计算来构建您的产品。现在您有了这些免费的云工具。
在获得所需的技能后,你开始在市场上找工作,但很快你就意识到公司需要更多。他们希望你了解数据工程、数据分析和MLOPS。在面试阶段,他们会询问你最近的项目和你部署模型的工作经验。
即使在学习了关键的必要技能后,你也会感到相当失望。这是因为大多数公司都在寻找有经验的个人或拥有多种技能的人。你提高机会的唯一方法就是不断学习一项新技能,不断参加机器学习比赛。这也将改善您的ML投资组合,并最终使您脱颖而出。如果你刚开始工作,很难找到工作。继续努力,最终,你会得到你梦寐以求的工作。
正如我上面提到的,它需要擅长各种技能:显然,一个优秀的机器学习工程师所需要的一切,比如好奇心、分析技能、算法知识、理解业务需求的能力,以及有效沟通的需求。还有更多。你需要善于构建需要机器学习操作经验的软件解决方案。Shanif Dhanani的机器学习工程师生活中的一天
除此之外,有时还必须执行迭代任务,如标记数据集。你可能找不到一份高薪的工作,但你最终会得到一份需要你全职和专注的工作。如果你进入这个领域只是因为它提供了一份高薪的工作,那么你应该开始考虑其他的选择。你在职业生涯中取得成功的唯一途径是对人工智能技术有坚定的热爱。
最后,我会一直建议你继续学习新的技能,开始参加Kaggle比赛。为了你的职业生涯,继续寻找新的工作,为你的技术面试做好准备。我只想向你们展示这个领域的实际情况。这并不漂亮,也不是每个人都能度过难关。只有努力工作和学习的心态,你才能找到一个舒适的职位,你有一个高薪的工作。
我们还讨论了机器学习如何不需要大量的数学、专业学位或博士学位。它不需要大量的计算能力或庞大的数据集。它只需要你的时间和努力工作。你可以在网上找到令人惊讶的课程,在学习了一些技能后,开始将这些技能应用到你的投资组合项目中。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01