京公网安备 11010802034615号
经营许可证编号:京B2-20210330
作者:梁唐
来源: 早起Python
早起导读
今天这篇文章咱们来聊聊这个问题。对于我来说python的应用场景主要是机器学习、深度学习相关,对于其他的场景涉猎不多。因此本文的目的并不是列举出一系列小项目给你们练手,而是希望引导大家思考这个问题,从而找到适合自己的练习项目。
python的误区
不知道各位初学者如何看待Python这一门语言,又是如何看待程序员的技能,根据我的理解, 这当中可能存在一些误解。其实不论哪一门语言的应用场景可能都不只是一个方向,往往是多个方向,尤其是Python这种比较成熟并且广受欢迎的语言,它在许多领域都有很高的建树,这就导致了Python可以做的事情非常多,相应的要学习的东西也就非常多。
也许在新手看来一个比较厉害的Python使用者,应该是所有技术通杀的,对于python的方方面面都非常了解。然而很遗憾,这是非常困难或者说几乎是不可能的。困难的原因也是很简单的,因为人的精力是有限的,想要在一个领域做到优秀就已经非常不容易,需要学习大量技术和知识了,更何况掌握所有方向。所以大家对于这样一个问题,应该有一个清晰的答案,对于Python这样一门语言,你们学习它的目的究竟是什么?
也许你有很多个答案,但是很遗憾,对于你未来职业发展来说,你可能只能选择其中一个。
方向选择
如果你玩过暗黑破坏神、魔兽世界或者是类似的RPG游戏的话,那么你对于选择职业这个问题应该非常了解。在我们刚进入游戏或者是进入游戏不久,我们就需要面临一次职业选择,职业一旦选择往往不可更改,你就需要在这个职业一直玩下去,如果想要换职业只有从头开始,重新玩一个新的号。
在职场当中和游戏是非常类似的,我们最终也需要选择我们的职业,并且我们只能选择一个岗位,轻易也是不能更改的。如果要更改,需要从头开始,之前累积的经验会全部清零。因为不同岗位对于能力的要求是完全不同的,所以对于初学者而言,其实也会面临这么一个选择,只不过这个选择是隐形的,当你选择岗位进行投递简历的时候,这个选择就潜移默化的发生了。
Python常用的基础语法并不多,在我们之前的文章当中几乎涵盖了大半。当我们完成了这部分学习之后,单单学习语法已经没有出路了。再接下来进阶就必须要学习一些应用上的内容,也就是要面临一个技术选型了。
对于Python而言,一般常见的方向有这么几种:web开发、机器学习、网络爬虫、运维、游戏开发。
下面我简单介绍一下这几个方向,大家可以对照一下自己的兴趣,选择一个自己感兴趣或者是比较适合的。
Web开发
Web开发应该是当下最普遍的程序员的工作岗位了,Python在web上的应用主要是web的后端开发,也就是负责服务器逻辑处理这个部分。
我们都知道在后端这个领域目前国内最吃香的语言应该是Java,几乎大半的公司都是使用Java作为后端语言。Java之后的其他几门语言我也难分伯仲,简单列举一下有新兴的Go,有古老的PHP,当然还有Python,还有已经几乎绝迹的C++和C#。Python在这个领域当中应该只能算是不算特别小众,总体来说还是偏小众的。
小众的原因和Python本身的特性有关,因为Python是解释型语言,而不是编译型语言。所以和Java、Go这种编译型语言相比,在性能上天然就要劣势。并且由于Python全局锁的限制,导致了Python多线程在计算密集型的并发场景当中表现非常糟糕,所以很少有大公司会使用Python作为后端主力语言。据我了解国内知名一些的应该只有豆瓣、知乎,国外的有YouTube,但据说有些已经迁移到其他语言了,有的已经有相应的迁移计划了。
Python在后端的主要优势在于敏捷,也就是开发效率比较高。Python的Django、Falsk等框架还是非常完善以及好用的,我们可以很快地从零开始搭建出一个像样的后端来,并且迭代的速度也很快。所以对于一些需要小步快跑对于性能要求不高的小公司,可能会选择Python,也就是大公司几乎不会选择Python作为Web后端的开发语言,技术栈也必然完全不同。
如果你需要选择这个方向,那么你除了要学习Python后端开发的相关知识,比如Django、Flask等框架之外,对于计算机网络以及前端也需要一定的了解,这些也是后端工程师的必修课。
总体来说,Python后端这个发展方向相对比较平坦,后期发力的难度比较大,天花板比较低。学习难度和Java后端相比可能要稍微简单一些,就业压力应该也还好,相关的岗位虽然不太多但也不会太少。
如果要选择这个领域的话,可以选择一些比较常规的项目作为入门的项目。比如搭建一个个人博客,或者是XX管理系统,等这些熟练了之后就可以学习更多其他的工具库了,比如数据库ORM框架、kafka、redis等这些常用的中间件。把这些内容再结合到web当中,创建出新的项目。等这一块也差不多了,接下来就可以研究研究架构设计、设计模式等等进阶的内容了。
这个领域我相对比较了解一些,对于机器学习来说,Python目前是妥妥的主力语言。早年还能看到一些使用R来做机器学习的工程师,目前已经几乎看不到了,几乎是清一色的Python。但是老实说机器学习当中Python只是起到胶水语言的作用,几乎所有核心的实现逻辑都不是Python支撑的。
在机器学习当中对于Python原生的内容要求非常普通,只需要会基本的语法,了解迭代器、生成器几乎就足够了。因为大部分内容都是通过框架或者是工具来实现的,Python只是把这些逻辑粘合到一起而已。这个方向的从业者的技能点在Python上的非常少,大部分都在机器学习的相关理论、一些库工具的使用、深度学习框架的使用、数据处理方面的经验。
并且机器学习本身就是一个比较大的领域,它也有很多方面的应用。比如搜索、广告、推荐这些传统的应用场景,以及CV(计算机视觉)、NLP(自然语言处理)、风控等等比较新一些的领域。所以选择了机器学习这个大方向,并且完成了基础知识的学习之后,还是要再面临一次选择的,因为还需要选择进一步细分的小方向。根据我个人的经验来说它们的发展前景是推荐、搜索、广告 > NLP > CV > 风控,这只是我个人的判断,仅供大家参考。
机器学习这个方向整体来说前景是非常不错的,目前几乎大中小型的公司都有机器学习或者是深度学习的岗位。虽然岗位多,但是竞争并不低,因为想要涌进来的人实在是太多了。尤其是这两年AI火热,大量的人想要挤进这个行业中来,所以招聘门槛还是不低的。
如果你想要选择这个方向的话,只需要基本的Python语法即可,但是需要对机器学习这个领域有着比较深入的学习。比如机器学习的核心概念、常用的一些模型、数据处理的一些方法、模型效果的评估标准等等。等对机器学习的理解足够了,就可以找kaggle、天池大数据等一些比赛来实战一下。
Python爬虫
爬虫这个方向大家也不陌生,很多人应该看过一些相关的负面新闻,比如窃取用户隐私或者是窃取了某某公司的数据等等。实际上爬虫的本质是利用程序模拟人工对网页进行访问,从而将网页当中相关有价值的信息存储下来。
Python由于语法简单,并且网络相关的工具库非常完善,而且不需要经过编译就可以直接运行。更重要的一点是Python的全局锁在网络请求这种IO密集型的场景当中非常合适,并不会影响效率。而且Python可以很方便的整合其他语言的功能以及特性,使得Python做爬虫非常合适,以至于市面上大部分的爬虫工程师都是以Python为语言开发的。并且现在也衍生了许多分布式爬虫的框架和工具。
由于大家都使用爬虫,而一些大公司不愿意自己的相关信息被竞争对手获取了去。举个例子,假设某东把淘宝所有的商品信息都爬取了下来,然后针对性的降价来强行吸引用户,那么显然对于淘宝是一个打击。为了防止类似以及其他不利于公司的情况出现,这些大公司都会设置一些反爬虫的机制。比如在请求来临时会判断是否是机器人,或者是会限制一个ip最多访问的商品数量等等。
既然有反爬机制,那么自然也有破除反爬机制的机制。所以公司里真正爬虫工程师往往的日常工作就是和一些大公司的反爬工程师斗智斗勇。你设置了这个反爬机制,我就想一个办法来破除。明天你发现了我的方法做了修补,我再继续想办法……并且在编写爬虫之前,需要做大量网页的分析,找到网页或者是应用中数据的源头api。有些公司会把api隐藏起来,或者是需要一定的校验才能访问,那么就需要设置一些方法针对性的破除之后才能使用爬虫。
有些人不喜欢这种斗智斗勇很多,开发时间很少的工作,而有些人就乐此不疲,大家可以对照一下自身的情况做一个选择。如果想要选择这个方向的话,可以从一些公开的没有设置反爬机制的数据开始,学习一些目前比较先进的爬虫框架,之后再一步步提升难度,去试着破除大公司的反爬机制,成为一个优秀的爬虫工程师。
运维和游戏开发
老实讲这两个领域我的了解实在是不多,所以硬着头皮简单说说,水平有限,如果有错误还请大家海涵。
运维在我们都知道就是负责维护机房机器环境、项目发布上线等工作的,由于现在公司用到的机器的数量越来越多,整个发布以及维护的流程也就越来越麻烦。之前极其少的时候还可以人工一台一台搞定,现在机器多了还使用人工来干显然就不现实了。为了解决这个问题,所以现在先进的运维会使用Python编写脚本,来批量操作机器安装环境或者是发布项目等等。
说白了其实也是把Python当成是脚本语言这样的工具来使用,核心的能力其实还是偏在Linux命令、操作系统、分布式集群这一个部分。对于运维这个领域,我个人感觉和机器学习差不多,Python只是纯工具,大家想要入门项目的话,可能还是要以运维相关的技能为主,使用Python来作为工具辅助。
游戏开发我稍稍了解一点,之前用Python做过一些简单的小游戏。Python当中的pygame非常好用,编写小游戏非常合适。并且Python也可以接入Unity,github里能搜到不少使用Python做出来的游戏。但是有没有游戏公司招聘Python程序员来进行游戏开发我就不清楚了,毕竟不是做这个行业的,但至少大家做一些小游戏来自娱自乐肯定还是没问题的。如果要练手的话可以考虑做一个2048,doodle jump这些比较简单的小游戏。
小结
如果只是寻找Python的新手入门项目,网上随便搜索一下出来的结果是非常多的。但是这并没有太多的意义,因为这些项目并不一定适合每一个人。而在明确自己想要从事的方向之前,合适与不合适也无从谈起,所以希望大家都可以先明确自己的方向,之后再找到对应的进阶道路则要容易得多。所以如果你之前只是想要学好Python这门语言,但是又没有考虑过方向相关的话,我建议你可以思考一下这方面的问题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03