京公网安备 11010802034615号
经营许可证编号:京B2-20210330
作者:梁唐
来源: 早起Python
早起导读
今天这篇文章咱们来聊聊这个问题。对于我来说python的应用场景主要是机器学习、深度学习相关,对于其他的场景涉猎不多。因此本文的目的并不是列举出一系列小项目给你们练手,而是希望引导大家思考这个问题,从而找到适合自己的练习项目。
python的误区
不知道各位初学者如何看待Python这一门语言,又是如何看待程序员的技能,根据我的理解, 这当中可能存在一些误解。其实不论哪一门语言的应用场景可能都不只是一个方向,往往是多个方向,尤其是Python这种比较成熟并且广受欢迎的语言,它在许多领域都有很高的建树,这就导致了Python可以做的事情非常多,相应的要学习的东西也就非常多。
也许在新手看来一个比较厉害的Python使用者,应该是所有技术通杀的,对于python的方方面面都非常了解。然而很遗憾,这是非常困难或者说几乎是不可能的。困难的原因也是很简单的,因为人的精力是有限的,想要在一个领域做到优秀就已经非常不容易,需要学习大量技术和知识了,更何况掌握所有方向。所以大家对于这样一个问题,应该有一个清晰的答案,对于Python这样一门语言,你们学习它的目的究竟是什么?
也许你有很多个答案,但是很遗憾,对于你未来职业发展来说,你可能只能选择其中一个。
方向选择
如果你玩过暗黑破坏神、魔兽世界或者是类似的RPG游戏的话,那么你对于选择职业这个问题应该非常了解。在我们刚进入游戏或者是进入游戏不久,我们就需要面临一次职业选择,职业一旦选择往往不可更改,你就需要在这个职业一直玩下去,如果想要换职业只有从头开始,重新玩一个新的号。
在职场当中和游戏是非常类似的,我们最终也需要选择我们的职业,并且我们只能选择一个岗位,轻易也是不能更改的。如果要更改,需要从头开始,之前累积的经验会全部清零。因为不同岗位对于能力的要求是完全不同的,所以对于初学者而言,其实也会面临这么一个选择,只不过这个选择是隐形的,当你选择岗位进行投递简历的时候,这个选择就潜移默化的发生了。
Python常用的基础语法并不多,在我们之前的文章当中几乎涵盖了大半。当我们完成了这部分学习之后,单单学习语法已经没有出路了。再接下来进阶就必须要学习一些应用上的内容,也就是要面临一个技术选型了。
对于Python而言,一般常见的方向有这么几种:web开发、机器学习、网络爬虫、运维、游戏开发。
下面我简单介绍一下这几个方向,大家可以对照一下自己的兴趣,选择一个自己感兴趣或者是比较适合的。
Web开发
Web开发应该是当下最普遍的程序员的工作岗位了,Python在web上的应用主要是web的后端开发,也就是负责服务器逻辑处理这个部分。
我们都知道在后端这个领域目前国内最吃香的语言应该是Java,几乎大半的公司都是使用Java作为后端语言。Java之后的其他几门语言我也难分伯仲,简单列举一下有新兴的Go,有古老的PHP,当然还有Python,还有已经几乎绝迹的C++和C#。Python在这个领域当中应该只能算是不算特别小众,总体来说还是偏小众的。
小众的原因和Python本身的特性有关,因为Python是解释型语言,而不是编译型语言。所以和Java、Go这种编译型语言相比,在性能上天然就要劣势。并且由于Python全局锁的限制,导致了Python多线程在计算密集型的并发场景当中表现非常糟糕,所以很少有大公司会使用Python作为后端主力语言。据我了解国内知名一些的应该只有豆瓣、知乎,国外的有YouTube,但据说有些已经迁移到其他语言了,有的已经有相应的迁移计划了。
Python在后端的主要优势在于敏捷,也就是开发效率比较高。Python的Django、Falsk等框架还是非常完善以及好用的,我们可以很快地从零开始搭建出一个像样的后端来,并且迭代的速度也很快。所以对于一些需要小步快跑对于性能要求不高的小公司,可能会选择Python,也就是大公司几乎不会选择Python作为Web后端的开发语言,技术栈也必然完全不同。
如果你需要选择这个方向,那么你除了要学习Python后端开发的相关知识,比如Django、Flask等框架之外,对于计算机网络以及前端也需要一定的了解,这些也是后端工程师的必修课。
总体来说,Python后端这个发展方向相对比较平坦,后期发力的难度比较大,天花板比较低。学习难度和Java后端相比可能要稍微简单一些,就业压力应该也还好,相关的岗位虽然不太多但也不会太少。
如果要选择这个领域的话,可以选择一些比较常规的项目作为入门的项目。比如搭建一个个人博客,或者是XX管理系统,等这些熟练了之后就可以学习更多其他的工具库了,比如数据库ORM框架、kafka、redis等这些常用的中间件。把这些内容再结合到web当中,创建出新的项目。等这一块也差不多了,接下来就可以研究研究架构设计、设计模式等等进阶的内容了。
这个领域我相对比较了解一些,对于机器学习来说,Python目前是妥妥的主力语言。早年还能看到一些使用R来做机器学习的工程师,目前已经几乎看不到了,几乎是清一色的Python。但是老实说机器学习当中Python只是起到胶水语言的作用,几乎所有核心的实现逻辑都不是Python支撑的。
在机器学习当中对于Python原生的内容要求非常普通,只需要会基本的语法,了解迭代器、生成器几乎就足够了。因为大部分内容都是通过框架或者是工具来实现的,Python只是把这些逻辑粘合到一起而已。这个方向的从业者的技能点在Python上的非常少,大部分都在机器学习的相关理论、一些库工具的使用、深度学习框架的使用、数据处理方面的经验。
并且机器学习本身就是一个比较大的领域,它也有很多方面的应用。比如搜索、广告、推荐这些传统的应用场景,以及CV(计算机视觉)、NLP(自然语言处理)、风控等等比较新一些的领域。所以选择了机器学习这个大方向,并且完成了基础知识的学习之后,还是要再面临一次选择的,因为还需要选择进一步细分的小方向。根据我个人的经验来说它们的发展前景是推荐、搜索、广告 > NLP > CV > 风控,这只是我个人的判断,仅供大家参考。
机器学习这个方向整体来说前景是非常不错的,目前几乎大中小型的公司都有机器学习或者是深度学习的岗位。虽然岗位多,但是竞争并不低,因为想要涌进来的人实在是太多了。尤其是这两年AI火热,大量的人想要挤进这个行业中来,所以招聘门槛还是不低的。
如果你想要选择这个方向的话,只需要基本的Python语法即可,但是需要对机器学习这个领域有着比较深入的学习。比如机器学习的核心概念、常用的一些模型、数据处理的一些方法、模型效果的评估标准等等。等对机器学习的理解足够了,就可以找kaggle、天池大数据等一些比赛来实战一下。
Python爬虫
爬虫这个方向大家也不陌生,很多人应该看过一些相关的负面新闻,比如窃取用户隐私或者是窃取了某某公司的数据等等。实际上爬虫的本质是利用程序模拟人工对网页进行访问,从而将网页当中相关有价值的信息存储下来。
Python由于语法简单,并且网络相关的工具库非常完善,而且不需要经过编译就可以直接运行。更重要的一点是Python的全局锁在网络请求这种IO密集型的场景当中非常合适,并不会影响效率。而且Python可以很方便的整合其他语言的功能以及特性,使得Python做爬虫非常合适,以至于市面上大部分的爬虫工程师都是以Python为语言开发的。并且现在也衍生了许多分布式爬虫的框架和工具。
由于大家都使用爬虫,而一些大公司不愿意自己的相关信息被竞争对手获取了去。举个例子,假设某东把淘宝所有的商品信息都爬取了下来,然后针对性的降价来强行吸引用户,那么显然对于淘宝是一个打击。为了防止类似以及其他不利于公司的情况出现,这些大公司都会设置一些反爬虫的机制。比如在请求来临时会判断是否是机器人,或者是会限制一个ip最多访问的商品数量等等。
既然有反爬机制,那么自然也有破除反爬机制的机制。所以公司里真正爬虫工程师往往的日常工作就是和一些大公司的反爬工程师斗智斗勇。你设置了这个反爬机制,我就想一个办法来破除。明天你发现了我的方法做了修补,我再继续想办法……并且在编写爬虫之前,需要做大量网页的分析,找到网页或者是应用中数据的源头api。有些公司会把api隐藏起来,或者是需要一定的校验才能访问,那么就需要设置一些方法针对性的破除之后才能使用爬虫。
有些人不喜欢这种斗智斗勇很多,开发时间很少的工作,而有些人就乐此不疲,大家可以对照一下自身的情况做一个选择。如果想要选择这个方向的话,可以从一些公开的没有设置反爬机制的数据开始,学习一些目前比较先进的爬虫框架,之后再一步步提升难度,去试着破除大公司的反爬机制,成为一个优秀的爬虫工程师。
运维和游戏开发
老实讲这两个领域我的了解实在是不多,所以硬着头皮简单说说,水平有限,如果有错误还请大家海涵。
运维在我们都知道就是负责维护机房机器环境、项目发布上线等工作的,由于现在公司用到的机器的数量越来越多,整个发布以及维护的流程也就越来越麻烦。之前极其少的时候还可以人工一台一台搞定,现在机器多了还使用人工来干显然就不现实了。为了解决这个问题,所以现在先进的运维会使用Python编写脚本,来批量操作机器安装环境或者是发布项目等等。
说白了其实也是把Python当成是脚本语言这样的工具来使用,核心的能力其实还是偏在Linux命令、操作系统、分布式集群这一个部分。对于运维这个领域,我个人感觉和机器学习差不多,Python只是纯工具,大家想要入门项目的话,可能还是要以运维相关的技能为主,使用Python来作为工具辅助。
游戏开发我稍稍了解一点,之前用Python做过一些简单的小游戏。Python当中的pygame非常好用,编写小游戏非常合适。并且Python也可以接入Unity,github里能搜到不少使用Python做出来的游戏。但是有没有游戏公司招聘Python程序员来进行游戏开发我就不清楚了,毕竟不是做这个行业的,但至少大家做一些小游戏来自娱自乐肯定还是没问题的。如果要练手的话可以考虑做一个2048,doodle jump这些比较简单的小游戏。
小结
如果只是寻找Python的新手入门项目,网上随便搜索一下出来的结果是非常多的。但是这并没有太多的意义,因为这些项目并不一定适合每一个人。而在明确自己想要从事的方向之前,合适与不合适也无从谈起,所以希望大家都可以先明确自己的方向,之后再找到对应的进阶道路则要容易得多。所以如果你之前只是想要学好Python这门语言,但是又没有考虑过方向相关的话,我建议你可以思考一下这方面的问题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06