
如果你是一个书呆子般的数据科学家,想要开始作为一个独立(远程)自由数据科学家工作,这篇文章是为你准备的。从现在朝九晚五的工作过渡到远程自由职业是一种解放的经历。最终收益是巨大的,包括:
我叫保·拉巴塔·巴约。我是一个自由数据科学家和ML工程师谁作为一个远程自由职业者在过去2年以上的工作。之前,我曾在一家顶级移动游戏公司Nordeus担任数据科学家。在我周围,我有一群伟大的数据科学家和了不起的数据工程师。当我加入这个团队的时候,他们已经在内部建立了数据分析平台,帮助公司管理一个每天活跃用户超过200万的游戏。我觉得我是另一只在一个成熟的蜂群中运作的蜜蜂。我90%的时间都花在技术上,包括数据分析以改进产品和ML开发以提高效率。10%的时间用于与团队其他成员交流我正在做的事情。
对于像我们这样的书呆子、数据科学家和ML怪人来说,这种分裂感觉很棒。然而,这种舒适有一个代价,我在两个不断的想法中想到了
最终,我辞去了工作,开始从事远程自由数据科学家的工作。这一转变既具有挑战性,也令人难以置信地丰富。在此过程中,我收集了一些知识,并将其浓缩为4个实用技巧,以帮助您加入我的行列,并开始走在另一边。
你的第一个问题是:我在哪里找到我的第一个项目?
互联网上有大量与数据相关的工作。如果你访问像Upwork这样的网站,你可以看到每分钟都有新的职位发布。是的,有很多数据科学工作,这是你每天早上都应该感谢的事情。然而,在那些巨大的网站上也有很多竞争。来自世界各地的自由职业者试图和你在同一个池塘里钓鱼。
你可能会想:
“考虑到我的技能和生活成本,让我们设定一个比我认为合理的低的工资,以增加我找到第一份工作的机会。”
大错。顺便说一句,我犯了两次这个错误。在我的第二个自由职业项目中,我和同一时区的另一位数据工程师一起工作,他的工资是我的两倍多。他第一次做自由职业。无数次我后悔我的聪明的定价。
大多数客户愿意支付更高的费率以减少项目的不确定性。你是一个非常合格的工作,过度的价格折扣也被解释为项目成功的更高的不确定性。此外,请记住,你试图说服另一个人,而不是成本最小化的Android。你需要表现出自信,设定一个比你认为自己价值更低的价格与此相反。
如今,有很多自由职业平台。我已经使用了其中的3个(Upwork,Toptal和Braintrust),但也可以随意探索其他的。
这些平台可分为两类:
大多数客户不是寻找一个全面的数据科学家,而是寻找一个可以解决他们问题的特定配置文件。一个非常了解如何
试图把自己表现为无所不能的终极自由数据科学家是很有诱惑力的,但这不是客户想要的。此外,数据科学是一个巨大的市场。通过缩小你的侧写,你仍然在一个相当大的池塘里钓鱼。记住这一点。
我的第一份自由职业可以粗略地描述为“我们的数据工程师没有一个能在Tableau中构建一个漂亮的仪表板。你能吗?“。这不是我能想到的最令人兴奋的工作,但这是我在以前的工作中做过一千次的事情。我是这方面的专家,这是对客户有价值的。
从专注于你已经是专家的项目开始你的道路。避免冒名顶替综合症,赢得你的第一张支票,建立信心。
兼职工作,甚至每小时工作,你可以学到和以前朝九晚五一样的东西。利用这个机会,在额外的时间里学习新的技能,为下一份合同中你想要工作的下一个领域做准备。
一个典型的错误是这样开始一个提案:
“亲爱的X。我叫Y,是一名数据科学家,在a、B、C和D领域有N年的经验。我有E方面的背景,而且……”
当然可以。你的潜在客户想知道你不可思议的背景。但她不是你爸妈。他想解决这个问题,所以直奔主题。从第一段开始专注于问题,没有序言和只能让她打哈欠的陈述。使用项目符号来列举与问题直接相关的非常具体的事情,并减少认知负荷。还有,把BS控制在最小。你喜欢读别人如何赞美自己吗?你的潜在客户也一样。
自从我开始做自由职业以来,我一直保留着我写的每一份提案。所有为我赢得工作的提案都有这样的结构:
“嗨X!我的名字是Y,最近我构建了N个与您的问题Z直接相关的东西:
我很乐意帮你做这件事。让我们本周打个电话来了解细节。最佳,Y.“
作为一名数据科学家的自由远程工作在智力和经济上都是令人难以置信的回报。如果这些建议能在你的自由职业道路上帮助你,我会感到非常高兴。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14