京公网安备 11010802034615号
经营许可证编号:京B2-20210330
随着人工智能、机器学习、深度学习的发展,这个领域也正在不断的进入人们的眼帘,并且带来了很多、很大的工作机会,随着这些机会的诞生,Python在这个机会中也在不断的发展壮大,因为Python不像其他语言一样复杂,Python简单易学容易被人们接受。并且这并不是我一个人在这里瞎说就可以证明的,在2019年6月PYPL流行程序设计语言中,Python排在第一位占到了28.08%,是第二名Java和第三名Javascript的和,并且还在不断的上涨中。
而且在另外一个编程语言TIOBE指数排行榜中,Python排在了第三位,排在第一位和第二位的是Java和C语言。并且排行榜还预测认为Python会在3-4年取代C和Java,而原因是软件工程行业正在不断的蓬勃发展,吸引了很多新人进入该领域,Java和C对于初学者来说一些困难,而Python相对于这两种语言来说,太过于简单了。
站在这里,我认为现在正在看这篇文章的你想要找一份有关于Python的工作,不然你也不会点进来不是,你可能是一个Python的初学者,或者说已经在Python工作岗位上已经工作过了,但是如果你还需要找一份Python的工作的话,你可能需要证明你知道如何使用Python。以下是一些涉及与Python相关的基础技能的问题。重点放在语言本身,而不是任何特定的包或框架。
某种程度上来说,我还没有遇到过这么难的面试,如果你能轻松的答对这些问题,找到正确的答案,那么就快去找份工作吧。
本教程不打算涵盖所有的工作场所因为不同的雇主会以不同的方式向你提出不同的问题; 他们会有各自的习惯; 他们重视的内容也是不同的。他们会以不同的方式测试你。有些老板会让你坐在电脑前,要求你解决简单的问题; 有些会让你在白板前站起来做类似的事; 有些人会给你一个需要让你回家解决的问题,方便节省他们的时间;而还有些人会和你谈谈。
而对程序员的最佳测试实际上就是编程。使用简单的教程测试是一件困难的事情。因此,为了面试过程中的加分,请确保你真的掌握了解决问题的方法。如果你真的很明白这些方法,那么你就可以利用解决问题的方法,使你获得胜利。
同样的,对于软件工程师的最有效的测试实际上是工程学。本教程是关于Python作为一种语言。能够设计高效,有效,可维护的类层次结构来解决小众问题是非常了不起的,并且是一项值得追求的技能,但是这就超出了本文的范围。
本教程不符合PEP8标准。这是有意的,因为如前所述,不同的老板将遵循不同的习惯。你需要适应公司的文化。因为实用性胜过一切。
本教程另一个不足之处是不够简洁。我不想只是向你提出问题和答案,而是希望有些事情可以解决。我希望你能够理解,或者至少理解的足够好,这样你们对任何有问题的话题能够进一步的去解释
Python到底是什么,你可以在回答中与其他技术进行比较(加分项)。
回答
以下是几个要点:
为什么这很重要:
如果你正在申请的是Python职位,你应该知道它是什么以及为什么它如此酷。
填写遗漏的代码:
def print_directory_contents(sPath):
"""
这个函数接受一个目录的名称
并且打印该目录中的路径文件
包含目录以及目录中的任何文件
这个函数类似于os.walk。
但是请不要使用这个模块系统。
输入你的答案
我们对你使用嵌套结构的能力很感兴趣
"""
fill_this_in
回答
def print_directory_contents(sPath):
import os
for sChild in os.listdir(sPath):
sChildPath = os.path.join(sPath,sChild)
if os.path.isdir(sChildPath):
print_directory_contents(sChildPath)
else:
print(sChildPath)
特别注意
为什么这很重要:
查看下面的代码,写下A0,A1,...An的最终值。
A0 = dict(zip(('a','b','c','d','e'),(1,2,3,4,5)))
A1 = range(10)
A2 = sorted([i for i in A1 if i in A0])
A3 = sorted([A0[s] for s in A0])
A4 = [i for i in A1 if i in A3]
A5 = {i:i*i for i in A1}
A6 = [[i,i*i] for i in A1]
如果你不知道什么是zip那么不用紧张。没有一个理智的雇主会要求你熟记标准库。这是help(zip)的输出。
zip(...)
zip(seq1 [, seq2 [...]]) -> [(seq1[0], seq2[0] ...), (...)]
Return a list of tuples, where each tuple contains the i-th element
from each of the argument sequences. The returned list is truncated
in length to the length of the shortest argument sequence.
如果这没有任何意义,那么就请你花几分钟去想清楚你要选择的方式。
回答
A0 = {'a': 1, 'c': 3, 'b': 2, 'e': 5, 'd': 4} # the order may vary
A1 = range(0, 10) # or [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] in python 2
A2 = []
A3 = [1, 2, 3, 4, 5]
A4 = [1, 2, 3, 4, 5]
A5 = {0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}
A6 = [[0, 0], [1, 1], [2, 4], [3, 9], [4, 16], [5, 25], [6, 36], [7, 49], [8, 64], [9, 81]]
为什么这很重要
多线程使用Python。这是个好主意吗?列出一些方法可以让一些Python代码以并行方式运行。
回答
Python不允许真正意义上的多线程。它有一个多线程包,但如果你想使用多线程来加速你的代码,那么使用它通常不是一个好主意。Python有一个名为全局解释器锁(Global Interpreter Lock(GIL))的结构。GIL确保每次只能执行一个“线程”。一个线程获取GIL,做一点工作,然后将GIL传递到下一个线程。这种情况发生的很快,因此对于人眼看来,你的线程似乎是并行运行的,但它们实际上只是轮流使用相同的CPU核心。所有这些GIL传递都增加了运行的内存。这意味着如果你想让代码运行得更快,那么使用线程包通常不是一个好主意。
使用Python的线程包也是有原因的。如果你想同时运行一些东西,并且效率不是一个问题,那么它就完全没问题了。或者,如果你正在运行需要等待某些事情的代码(例如某些IO),那么它可能会很有意义。但是线程库不会让你使用额外的CPU核心。
多线程可以外包到操作系统(通过多处理),一些调用Python代码的外部应用程序(例如,Spark或Hadoop),或者Python代码调用的一些代码例如:你可以使用你的Python代码调用一个C函数来完成昂贵的多线程事务。
为什么这很重要
因为GIL是一个A-hole。在学习GIL之前,很多人花了很多的时间在他们的Python多线程中遇到了瓶颈。
如何跟踪代码的不同版本?
回答:
版本控制!此时,你应该表现的非常兴奋,并告诉他们你如何使用Git(或任何你最喜欢的)来跟踪与Granny的通信。Git是我首选的版本控制系统,但还有其他版本控制系统,例如subversion。
为什么这很重要:
因为没有版本控制的代码就像没有杯子的咖啡。有时我们需要编写一次性丢弃的脚本,这没关系,但是如果你正在处理大量的代码,版本控制系统将是一个优势。版本控制有助于跟踪谁对代码库进行了哪些更改; 找出Bug是什么时候引入代码的; 跟踪软件的版本和发布版本; 在团队成员之间分发源代码; 部署和某些自动化。它允许你在破坏代码之前将代码转回到自己的代码之上。等等很多东西。这太棒了。
这段代码输出了什么:
def f(x,l=[]):
for i in range(x):
l.append(i*i)
print(l)
f(2)
f(3,[3,2,1])
f(3)
回答
[0, 1]
[3, 2, 1, 0, 1, 4]
[0, 1, 0, 1, 4]
为什么重要?
第一个函数调用应该相当明显,循环将0和1附加到空列表中l.l是指向存储在内存中的列表的变量的名称。 第二个调用通过在新的内存块中创建新列表开始。l然后指向这个新列表。然后它将0,1和4附加到这个新列表中。这太好了。 第三个函数调用是奇怪的。它使用存储在原始内存块中的原始列表。这就是它从0和1开始的原因。
如果你不明白,试试这个:
l_mem = []
l = l_mem # the first call
for i in range(2):
l.append(i*i)
print(l) # [0, 1]
l = [3,2,1] # the second call
for i in range(3):
l.append(i*i)
print(l) # [3, 2, 1, 0, 1, 4]
l = l_mem # the third call
for i in range(3):
l.append(i*i)
print(l) # [0, 1, 0, 1, 4]
什么是猴子补丁?,这是个好主意吗?
回答
猴子补丁是在定义函数或对象已经定义后进行更改的行为。例如:
import datetime
datetime.datetime.now = lambda: datetime.datetime(2012, 12, 12)
大多数时候,这是一个非常糟糕的想法 - 如果事情以明确的方式运行,通常是最好的。猴子补丁的一个原因是测试。该模拟包对此还是非常有用的。
为什么这很重要
它表明你对单元测试中的方法有所了解。你提到避免使用猴子补丁会表明你不是那些喜欢花哨的代码而不喜欢可维护代码的程序员(他们就在那里,而且合作起来会非常糟糕)。它表明你对Python如何在较低层次上工作,如何实际存储和调用函数等有所了解。
这是什么东西的意思是:*args,**kwargs?我们为什么要用它呢?
回答
当我们不确定要向函数传递多少参数时,或者我们想向函数传递已存储的列表或参数元组时使用*args。**kwargs用于当我们不知道将多少关键字参数传递给函数时,或者它可以用用于关键字参数传递字典的值。标识符args和kwargs是一种约定,你也可以使用*bob,**billy但这不是明智的。
这是一个小示例:
def f(*args,**kwargs): print(args, kwargs)
l = [1,2,3]
t = (4,5,6)
d = {'a':7,'b':8,'c':9}
f()
f(1,2,3) # (1, 2, 3) {}
f(1,2,3,"groovy") # (1, 2, 3, 'groovy') {}
f(a=1,b=2,c=3) # () {'a': 1, 'c': 3, 'b': 2}
f(a=1,b=2,c=3,zzz="hi") # () {'a': 1, 'c': 3, 'b': 2, 'zzz': 'hi'}
f(1,2,3,a=1,b=2,c=3) # (1, 2, 3) {'a': 1, 'c': 3, 'b': 2}
f(*l,**d) # (1, 2, 3) {'a': 7, 'c': 9, 'b': 8}
f(*t,**d) # (4, 5, 6) {'a': 7, 'c': 9, 'b': 8}
f(1,2,*t) # (1, 2, 4, 5, 6) {}
f(q="winning",**d) # () {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}
f(1,2,*t,q="winning",**d) # (1, 2, 4, 5, 6) {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}
def f2(arg1,arg2,*args,**kwargs): print(arg1,arg2, args, kwargs)
f2(1,2,3) # 1 2 (3,) {}
f2(1,2,3,"groovy") # 1 2 (3, 'groovy') {}
f2(arg1=1,arg2=2,c=3) # 1 2 () {'c': 3}
f2(arg1=1,arg2=2,c=3,zzz="hi") # 1 2 () {'c': 3, 'zzz': 'hi'}
f2(1,2,3,a=1,b=2,c=3) # 1 2 (3,) {'a': 1, 'c': 3, 'b': 2}
f2(*l,**d) # 1 2 (3,) {'a': 7, 'c': 9, 'b': 8}
f2(*t,**d) # 4 5 (6,) {'a': 7, 'c': 9, 'b': 8}
f2(1,2,*t) # 1 2 (4, 5, 6) {}
f2(1,1,q="winning",**d) # 1 1 () {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}
f2(1,2,*t,q="winning",**d) # 1 2 (4, 5, 6) {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}
为什么关心?
有时我们需要将未知数量的参数或关键字参数传递给函数。有时我们会想要存储参数或关键字参数供以后使用。有时它只是节省时间。
这些对你来说意味着:@classmethod,@staticmethod,@property?
回答背景知识
这些是装饰者。装饰器是一种特殊的函数,它既可以获取函数并可以返回一个函数,或者获取一个类并返回一个类。该@符号只是语法糖,允许你以一种易于阅读的方式装饰一些东西。
@my_decorator
def my_func(stuff):
do_things
相当于
def my_func(stuff):
do_things
my_func = my_decorator(my_func)
实际答案
装饰器@classmethod,@staticmethod和@property是在类中定义的函数的时候使用。以下是他们的行为方式:
class MyClass(object):
def __init__(self):
self._some_property = "properties are nice"
self._some_other_property = "VERY nice"
def normal_method(*args,**kwargs):
print("calling normal_method({0},{1})".format(args,kwargs))
@classmethod
def class_method(*args,**kwargs):
print("calling class_method({0},{1})".format(args,kwargs))
@staticmethod
def static_method(*args,**kwargs):
print("calling static_method({0},{1})".format(args,kwargs))
@property
def some_property(self,*args,**kwargs):
print("calling some_property getter({0},{1},{2})".format(self,args,kwargs))
return self._some_property
@some_property.setter
def some_property(self,*args,**kwargs):
print("calling some_property setter({0},{1},{2})".format(self,args,kwargs))
self._some_property = args[0]
@property
def some_other_property(self,*args,**kwargs):
print("calling some_other_property getter({0},{1},{2})".format(self,args,kwargs))
return self._some_other_property
o = MyClass()
#未修饰方法的工作原理与普通方法一样,它们将当前实例(self)作为第一个参数
o.normal_method
#
o.normal_method()
# normal_method((<__main__.MyClass instance at 0x7fdd2537ea28>,),{})
o.normal_method(1,2,x=3,y=4)
# normal_method((<__main__.MyClass instance at 0x7fdd2537ea28>, 1, 2),{'y': 4, 'x': 3})
# class methods always get the class as the first argument
o.class_method
#
o.class_method()
# class_method((
o.class_method(1,2,x=3,y=4)
# class_method((
# static methods have no arguments except the ones you pass in when you call them
o.static_method
#
o.static_method()
# static_method((),{})
o.static_method(1,2,x=3,y=4)
# static_method((1, 2),{'y': 4, 'x': 3})
# properties are a way of implementing getters and setters. It's an error to explicitly call them
# "read only" attributes can be specified by creating a getter without a setter (as in some_other_property)
o.some_property
# calling some_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})
# 'properties are nice'
o.some_property()
# calling some_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})
# Traceback (most recent call last):
# File "", line 1, in
# TypeError: 'str' object is not callable
o.some_other_property
# calling some_other_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})
# 'VERY nice'
# o.some_other_property()
# calling some_other_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})
# Traceback (most recent call last):
# File "", line 1, in
# TypeError: 'str' object is not callable
o.some_property = "groovy"
# calling some_property setter(<__main__.MyClass object at 0x7fb2b7077890>,('groovy',),{})
o.some_property
# calling some_property getter(<__main__.MyClass object at 0x7fb2b7077890>,(),{})
# 'groovy'
o.some_other_property = "very groovy"
# Traceback (most recent call last):
# File "", line 1, in
# AttributeError: can't set attribute
o.some_other_property
# calling some_other_property getter(<__main__.MyClass object at 0x7fb2b7077890>,(),{})
# 'VERY nice'
想想下面这串代码,它将输出什么?
class A(object):
def go(self):
print("go A go!")
def stop(self):
print("stop A stop!")
def pause(self):
raise Exception("Not Implemented")
class B(A):
def go(self):
super(B, self).go()
print("go B go!")
class C(A):
def go(self):
super(C, self).go()
print("go C go!")
def stop(self):
super(C, self).stop()
print("stop C stop!")
class D(B,C):
def go(self):
super(D, self).go()
print("go D go!")
def stop(self):
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15