京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2020年3月,我接到一个电话,通知我将休假,直到另行通知--非正式地意味着我将得到学习的报酬。我知道我在休假期结束后被解雇的可能性很高,因为我没有积极工作的项目。
尽管我在工作中没有做太多关于数据的工作,但一想到不能做任何关于数据的有意义的工作,我就很困扰。尽管如此,我觉得我对下一步可能做什么的选择有限,因为我在工作中没有太多的实际经验。不要误解我,我一直在实习,但在我的时间里,我没有做任何事情来显著(甚至轻微)改善业务(至少在我看来是这样)。我处于一个非常低的位置,缺乏自信,怀疑自己的技能……对我来说,休假不能早点到来。
我做出的第一个具有变革性的决定是致力于成为一名面向未来的、不可抗拒的数据科学家。
当你承诺做某事时,一种来自内心的力量驱使着你。我每天醒来都在想我今天一定比昨天更好,这就是我的动力。然而,在这篇文章中,我将分享我在休假期间做的三件事,以确保我更接近我的目标。
当我解释机器学习中的理论概念时,我很舒服,但我不满意。
每当我在Kaggle上查看人们使用的解决方案时,我总是看到某种形式的提升、套袋或深度学习。提升和装袋,我有很好的理解,但深度学习对我来说是一个禁区。当我意识到这一点时,我决定报名参加Coursera的深度学习专业。
深度学习
从deeplearning.ai中学习深度学习。如果你想闯入人工智能(AI),这种专业化...
在本课程中,我学习了许多基本的深度学习架构和技术,以改进深度学习模型。
我在编程方面已经相当不错了,但每当我听到关于人们如何在这个领域建立职业生涯的播客时,有一件事总是让我感到突出。
推倒重来好获得深刻的理解!
我从来没有从头开始编写机器学习算法,这让我怀疑我是否真的知道发生了什么。
因此,我向自己提出了一个挑战,从头开始编写许多最流行的机器学习算法--对于那些长期关注我的帖子的人来说,你应该知道这是从头开始的算法系列。
算法从头开始-迈向数据科学
阅读《走向数据科学》中关于从头开始算法的写作。共享概念、想法和...的媒体出版物
此外,我认为提高我对关键数据科学框架的技能是很重要的,比如NumPy和Pandas,因此我还创建了Pytrix系列。
Pytrix系列-迈向数据科学
阅读《走向数据科学》中关于Pytrix系列的文章。共享概念、想法和代码的媒体出版物。
我决定把发帖的频率从每周一次增加到每周3次。这个变化迫使我做了两件重要的事情,我认为这对我的成长至关重要:
作为一名数据科学家,不断学习是必不可少的。我们都知道技术发展的有多快,所以要保持敏锐,我们必须磨利我们的斧头。然而,当你学习一个新的话题,意图将这些信息反哺给其他人时,尽管我没有做过这方面的研究,但我发现我以不同的方式吸收信息--我对我正在学习的东西进行更深入的思考,并试图在脑海中想象出来,这一切都有助于使学习成为一个无缝的过程。
最好的数据科学家并不是最聪明的。
软技能在大多数MOOCs都不教,你必须自己出去学习。
成为一名数据科学家的要求,例如知道如何编程、统计学、线性代数、微积分和其他关键的数据概念,往往会让有抱负的数据科学家消耗太多,以至于很容易忘记作为一名数据科学家最重要的部分……能够理解业务想要实现什么,然后使用数据来增加价值。
换句话说,一个好的数据科学家知道很多技术概念,但他们与伟大的数据科学家的区别在于,他们有能力接受一个技术概念,然后简化它,并以一种包容团队所有成员的方式交流它,而不管他们的技术水平如何。
“如果你不能简单地解释它,你就不够了解它”
在我个人看来,每一个数据科学家都是一个个人品牌。维基百科对Entrepreneurship的定义是价值的创造或提取-有效地说,这是作为一名数据科学家的本质。
人们通常只有当他们认为是时候让他们成为一个数据科学的角色时才开始联网,我认为这完全是胡说八道。
在你需要之前建立你的关系网。
在过去的8个月里,构建数据科学网络帮助我改进了5种方法:
协助
有些人在生活中走在你前面,我个人相信宇宙允许我们与这些人相遇,这样他们就可以引导你。让我们面对现实吧,在你的数据科学职业生涯中,你需要寻求帮助!
市场营销
一个强大的网络是一个伟大的试验场的想法。我在我的LinkedIn上进行了多次民意调查,这为我提供了即时反馈。此外,您还可以获得个人推荐。就目前情况来看,我从来没有申请过工作,因为我一直知道口碑的力量,我已经在许多领域利用它为我的优势--无论哪个领域。
向别人学习
你不可能知道数据科学中的所有东西(或者一般的生活),拥有不同的人脉会让你接触到新的东西。经验并不重要,如果你有一个良好的网络,你会学到一些新的东西。
交朋友
如果你问那些在我身边长大的人人工智能是什么,他们可能会用《黑镜》中的一些东西来回答。在这个领域没有朋友可能会很孤独,因为有时你会感到疲倦、没有动力,而你的非数据科学朋友可能无法理解你。与其他数据科学家建立联系会让你意识到你不是世界上唯一一个面临某种挑战的人,当我感到沮丧时,它肯定会让我重新振作起来。
人们知道您必须提供什么
把任何关系粘在一起的胶水都附着在每个人带到桌子上的东西的两边,就是这样。如果人们知道你是做什么的,把你介绍给别人就容易多了--这就是我在8月份获得自由职业的原因。
值得注意的一件关键事情是,我已经在这个领域有了很多接触,这是让我像现在这样进步的原因;我想说,我所做的改变我职业生涯轨迹的最重要的事情是承诺。承诺是一个长期的决定,每天提高自己只有在你的手中。对你的职业生涯负责,是发展你自己的开始。虽然我离我想要的数据科学职业生涯还很远,但我比昨天更近了,比8个月前更近了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11在CDA(Certified Data Analyst)数据分析师的实操体系中,统计基本概念是不可或缺的核心根基,更是连接原始数据与业务洞察的关 ...
2026-02-11在数字经济飞速发展的今天,数据已成为核心生产要素,渗透到企业运营、民生服务、科技研发等各个领域。从个人手机里的浏览记录、 ...
2026-02-10在数据分析、实验研究中,我们经常会遇到小样本配对数据的差异检验场景——比如同一组受试者用药前后的指标对比、配对分组的两组 ...
2026-02-10在结构化数据分析领域,透视分析(Pivot Analysis)是CDA(Certified Data Analyst)数据分析师最常用、最高效的核心实操方法之 ...
2026-02-10在SQL数据库实操中,字段类型的合理设置是保证数据运算、统计准确性的基础。日常开发或数据分析时,我们常会遇到这样的问题:数 ...
2026-02-09在日常办公数据分析中,Excel数据透视表是最常用的高效工具之一——它能快速对海量数据进行分类汇总、分组统计,将杂乱无章的数 ...
2026-02-09表结构数据作为结构化数据的核心载体,其“获取-加工-使用”全流程,是CDA(Certified Data Analyst)数据分析师开展专业工作的 ...
2026-02-09在互联网产品运营、用户增长的实战场景中,很多从业者都会陷入一个误区:盲目投入资源做推广、拉新,却忽视了“拉新后的用户激活 ...
2026-02-06