京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2020年3月,我接到一个电话,通知我将休假,直到另行通知--非正式地意味着我将得到学习的报酬。我知道我在休假期结束后被解雇的可能性很高,因为我没有积极工作的项目。
尽管我在工作中没有做太多关于数据的工作,但一想到不能做任何关于数据的有意义的工作,我就很困扰。尽管如此,我觉得我对下一步可能做什么的选择有限,因为我在工作中没有太多的实际经验。不要误解我,我一直在实习,但在我的时间里,我没有做任何事情来显著(甚至轻微)改善业务(至少在我看来是这样)。我处于一个非常低的位置,缺乏自信,怀疑自己的技能……对我来说,休假不能早点到来。
我做出的第一个具有变革性的决定是致力于成为一名面向未来的、不可抗拒的数据科学家。
当你承诺做某事时,一种来自内心的力量驱使着你。我每天醒来都在想我今天一定比昨天更好,这就是我的动力。然而,在这篇文章中,我将分享我在休假期间做的三件事,以确保我更接近我的目标。
当我解释机器学习中的理论概念时,我很舒服,但我不满意。
每当我在Kaggle上查看人们使用的解决方案时,我总是看到某种形式的提升、套袋或深度学习。提升和装袋,我有很好的理解,但深度学习对我来说是一个禁区。当我意识到这一点时,我决定报名参加Coursera的深度学习专业。
深度学习
从deeplearning.ai中学习深度学习。如果你想闯入人工智能(AI),这种专业化...
在本课程中,我学习了许多基本的深度学习架构和技术,以改进深度学习模型。
我在编程方面已经相当不错了,但每当我听到关于人们如何在这个领域建立职业生涯的播客时,有一件事总是让我感到突出。
推倒重来好获得深刻的理解!
我从来没有从头开始编写机器学习算法,这让我怀疑我是否真的知道发生了什么。
因此,我向自己提出了一个挑战,从头开始编写许多最流行的机器学习算法--对于那些长期关注我的帖子的人来说,你应该知道这是从头开始的算法系列。
算法从头开始-迈向数据科学
阅读《走向数据科学》中关于从头开始算法的写作。共享概念、想法和...的媒体出版物
此外,我认为提高我对关键数据科学框架的技能是很重要的,比如NumPy和Pandas,因此我还创建了Pytrix系列。
Pytrix系列-迈向数据科学
阅读《走向数据科学》中关于Pytrix系列的文章。共享概念、想法和代码的媒体出版物。
我决定把发帖的频率从每周一次增加到每周3次。这个变化迫使我做了两件重要的事情,我认为这对我的成长至关重要:
作为一名数据科学家,不断学习是必不可少的。我们都知道技术发展的有多快,所以要保持敏锐,我们必须磨利我们的斧头。然而,当你学习一个新的话题,意图将这些信息反哺给其他人时,尽管我没有做过这方面的研究,但我发现我以不同的方式吸收信息--我对我正在学习的东西进行更深入的思考,并试图在脑海中想象出来,这一切都有助于使学习成为一个无缝的过程。
最好的数据科学家并不是最聪明的。
软技能在大多数MOOCs都不教,你必须自己出去学习。
成为一名数据科学家的要求,例如知道如何编程、统计学、线性代数、微积分和其他关键的数据概念,往往会让有抱负的数据科学家消耗太多,以至于很容易忘记作为一名数据科学家最重要的部分……能够理解业务想要实现什么,然后使用数据来增加价值。
换句话说,一个好的数据科学家知道很多技术概念,但他们与伟大的数据科学家的区别在于,他们有能力接受一个技术概念,然后简化它,并以一种包容团队所有成员的方式交流它,而不管他们的技术水平如何。
“如果你不能简单地解释它,你就不够了解它”
在我个人看来,每一个数据科学家都是一个个人品牌。维基百科对Entrepreneurship的定义是价值的创造或提取-有效地说,这是作为一名数据科学家的本质。
人们通常只有当他们认为是时候让他们成为一个数据科学的角色时才开始联网,我认为这完全是胡说八道。
在你需要之前建立你的关系网。
在过去的8个月里,构建数据科学网络帮助我改进了5种方法:
协助
有些人在生活中走在你前面,我个人相信宇宙允许我们与这些人相遇,这样他们就可以引导你。让我们面对现实吧,在你的数据科学职业生涯中,你需要寻求帮助!
市场营销
一个强大的网络是一个伟大的试验场的想法。我在我的LinkedIn上进行了多次民意调查,这为我提供了即时反馈。此外,您还可以获得个人推荐。就目前情况来看,我从来没有申请过工作,因为我一直知道口碑的力量,我已经在许多领域利用它为我的优势--无论哪个领域。
向别人学习
你不可能知道数据科学中的所有东西(或者一般的生活),拥有不同的人脉会让你接触到新的东西。经验并不重要,如果你有一个良好的网络,你会学到一些新的东西。
交朋友
如果你问那些在我身边长大的人人工智能是什么,他们可能会用《黑镜》中的一些东西来回答。在这个领域没有朋友可能会很孤独,因为有时你会感到疲倦、没有动力,而你的非数据科学朋友可能无法理解你。与其他数据科学家建立联系会让你意识到你不是世界上唯一一个面临某种挑战的人,当我感到沮丧时,它肯定会让我重新振作起来。
人们知道您必须提供什么
把任何关系粘在一起的胶水都附着在每个人带到桌子上的东西的两边,就是这样。如果人们知道你是做什么的,把你介绍给别人就容易多了--这就是我在8月份获得自由职业的原因。
值得注意的一件关键事情是,我已经在这个领域有了很多接触,这是让我像现在这样进步的原因;我想说,我所做的改变我职业生涯轨迹的最重要的事情是承诺。承诺是一个长期的决定,每天提高自己只有在你的手中。对你的职业生涯负责,是发展你自己的开始。虽然我离我想要的数据科学职业生涯还很远,但我比昨天更近了,比8个月前更近了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析实战中,我们经常会遇到“多指标冗余”的问题——比如分析企业经营状况时,需同时关注营收、利润、负债率、周转率等十 ...
2026-02-04在数据分析场景中,基准比是衡量指标表现、评估业务成效、对比个体/群体差异的核心工具,广泛应用于绩效评估、业务监控、竞品对 ...
2026-02-04业务数据分析是企业日常运营的核心支撑,其核心价值在于将零散的业务数据转化为可落地的业务洞察,破解运营痛点、优化业务流程、 ...
2026-02-04在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27