
随着人工智能、机器学习、深度学习的发展,这个领域也正在不断的进入人们的眼帘,并且带来了很多、很大的工作机会,随着这些机会的诞生,Python在这个机会中也在不断的发展壮大,因为Python不像其他语言一样复杂,Python简单易学容易被人们接受。并且这并不是我一个人在这里瞎说就可以证明的,在2019年6月PYPL流行程序设计语言中,Python排在第一位占到了28.08%,是第二名Java和第三名Javascript的和,并且还在不断的上涨中。
而且在另外一个编程语言TIOBE指数排行榜中,Python排在了第三位,排在第一位和第二位的是Java和C语言。并且排行榜还预测认为Python会在3-4年取代C和Java,而原因是软件工程行业正在不断的蓬勃发展,吸引了很多新人进入该领域,Java和C对于初学者来说一些困难,而Python相对于这两种语言来说,太过于简单了。
站在这里,我认为现在正在看这篇文章的你想要找一份有关于Python的工作,不然你也不会点进来不是,你可能是一个Python的初学者,或者说已经在Python工作岗位上已经工作过了,但是如果你还需要找一份Python的工作的话,你可能需要证明你知道如何使用Python。以下是一些涉及与Python相关的基础技能的问题。重点放在语言本身,而不是任何特定的包或框架。
某种程度上来说,我还没有遇到过这么难的面试,如果你能轻松的答对这些问题,找到正确的答案,那么就快去找份工作吧。
本教程不打算涵盖所有的工作场所因为不同的雇主会以不同的方式向你提出不同的问题; 他们会有各自的习惯; 他们重视的内容也是不同的。他们会以不同的方式测试你。有些老板会让你坐在电脑前,要求你解决简单的问题; 有些会让你在白板前站起来做类似的事; 有些人会给你一个需要让你回家解决的问题,方便节省他们的时间;而还有些人会和你谈谈。
而对程序员的最佳测试实际上就是编程。使用简单的教程测试是一件困难的事情。因此,为了面试过程中的加分,请确保你真的掌握了解决问题的方法。如果你真的很明白这些方法,那么你就可以利用解决问题的方法,使你获得胜利。
同样的,对于软件工程师的最有效的测试实际上是工程学。本教程是关于Python作为一种语言。能够设计高效,有效,可维护的类层次结构来解决小众问题是非常了不起的,并且是一项值得追求的技能,但是这就超出了本文的范围。
本教程不符合PEP8标准。这是有意的,因为如前所述,不同的老板将遵循不同的习惯。你需要适应公司的文化。因为实用性胜过一切。
本教程另一个不足之处是不够简洁。我不想只是向你提出问题和答案,而是希望有些事情可以解决。我希望你能够理解,或者至少理解的足够好,这样你们对任何有问题的话题能够进一步的去解释
Python到底是什么,你可以在回答中与其他技术进行比较(加分项)。
回答
以下是几个要点:
为什么这很重要:
如果你正在申请的是Python职位,你应该知道它是什么以及为什么它如此酷。
填写遗漏的代码:
def print_directory_contents(sPath):
"""
这个函数接受一个目录的名称
并且打印该目录中的路径文件
包含目录以及目录中的任何文件
这个函数类似于os.walk。
但是请不要使用这个模块系统。
输入你的答案
我们对你使用嵌套结构的能力很感兴趣
"""
fill_this_in
回答
def print_directory_contents(sPath):
import os
for sChild in os.listdir(sPath):
sChildPath = os.path.join(sPath,sChild)
if os.path.isdir(sChildPath):
print_directory_contents(sChildPath)
else:
print(sChildPath)
特别注意
为什么这很重要:
查看下面的代码,写下A0,A1,...An的最终值。
A0 = dict(zip(('a','b','c','d','e'),(1,2,3,4,5)))
A1 = range(10)
A2 = sorted([i for i in A1 if i in A0])
A3 = sorted([A0[s] for s in A0])
A4 = [i for i in A1 if i in A3]
A5 = {i:i*i for i in A1}
A6 = [[i,i*i] for i in A1]
如果你不知道什么是zip那么不用紧张。没有一个理智的雇主会要求你熟记标准库。这是help(zip)的输出。
zip(...)
zip(seq1 [, seq2 [...]]) -> [(seq1[0], seq2[0] ...), (...)]
Return a list of tuples, where each tuple contains the i-th element
from each of the argument sequences. The returned list is truncated
in length to the length of the shortest argument sequence.
如果这没有任何意义,那么就请你花几分钟去想清楚你要选择的方式。
回答
A0 = {'a': 1, 'c': 3, 'b': 2, 'e': 5, 'd': 4} # the order may vary
A1 = range(0, 10) # or [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] in python 2
A2 = []
A3 = [1, 2, 3, 4, 5]
A4 = [1, 2, 3, 4, 5]
A5 = {0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}
A6 = [[0, 0], [1, 1], [2, 4], [3, 9], [4, 16], [5, 25], [6, 36], [7, 49], [8, 64], [9, 81]]
为什么这很重要
多线程使用Python。这是个好主意吗?列出一些方法可以让一些Python代码以并行方式运行。
回答
Python不允许真正意义上的多线程。它有一个多线程包,但如果你想使用多线程来加速你的代码,那么使用它通常不是一个好主意。Python有一个名为全局解释器锁(Global Interpreter Lock(GIL))的结构。GIL确保每次只能执行一个“线程”。一个线程获取GIL,做一点工作,然后将GIL传递到下一个线程。这种情况发生的很快,因此对于人眼看来,你的线程似乎是并行运行的,但它们实际上只是轮流使用相同的CPU核心。所有这些GIL传递都增加了运行的内存。这意味着如果你想让代码运行得更快,那么使用线程包通常不是一个好主意。
使用Python的线程包也是有原因的。如果你想同时运行一些东西,并且效率不是一个问题,那么它就完全没问题了。或者,如果你正在运行需要等待某些事情的代码(例如某些IO),那么它可能会很有意义。但是线程库不会让你使用额外的CPU核心。
多线程可以外包到操作系统(通过多处理),一些调用Python代码的外部应用程序(例如,Spark或Hadoop),或者Python代码调用的一些代码例如:你可以使用你的Python代码调用一个C函数来完成昂贵的多线程事务。
为什么这很重要
因为GIL是一个A-hole。在学习GIL之前,很多人花了很多的时间在他们的Python多线程中遇到了瓶颈。
如何跟踪代码的不同版本?
回答:
版本控制!此时,你应该表现的非常兴奋,并告诉他们你如何使用Git(或任何你最喜欢的)来跟踪与Granny的通信。Git是我首选的版本控制系统,但还有其他版本控制系统,例如subversion。
为什么这很重要:
因为没有版本控制的代码就像没有杯子的咖啡。有时我们需要编写一次性丢弃的脚本,这没关系,但是如果你正在处理大量的代码,版本控制系统将是一个优势。版本控制有助于跟踪谁对代码库进行了哪些更改; 找出Bug是什么时候引入代码的; 跟踪软件的版本和发布版本; 在团队成员之间分发源代码; 部署和某些自动化。它允许你在破坏代码之前将代码转回到自己的代码之上。等等很多东西。这太棒了。
这段代码输出了什么:
def f(x,l=[]):
for i in range(x):
l.append(i*i)
print(l)
f(2)
f(3,[3,2,1])
f(3)
回答
[0, 1]
[3, 2, 1, 0, 1, 4]
[0, 1, 0, 1, 4]
为什么重要?
第一个函数调用应该相当明显,循环将0和1附加到空列表中l.l是指向存储在内存中的列表的变量的名称。 第二个调用通过在新的内存块中创建新列表开始。l然后指向这个新列表。然后它将0,1和4附加到这个新列表中。这太好了。 第三个函数调用是奇怪的。它使用存储在原始内存块中的原始列表。这就是它从0和1开始的原因。
如果你不明白,试试这个:
l_mem = []
l = l_mem # the first call
for i in range(2):
l.append(i*i)
print(l) # [0, 1]
l = [3,2,1] # the second call
for i in range(3):
l.append(i*i)
print(l) # [3, 2, 1, 0, 1, 4]
l = l_mem # the third call
for i in range(3):
l.append(i*i)
print(l) # [0, 1, 0, 1, 4]
什么是猴子补丁?,这是个好主意吗?
回答
猴子补丁是在定义函数或对象已经定义后进行更改的行为。例如:
import datetime
datetime.datetime.now = lambda: datetime.datetime(2012, 12, 12)
大多数时候,这是一个非常糟糕的想法 - 如果事情以明确的方式运行,通常是最好的。猴子补丁的一个原因是测试。该模拟包对此还是非常有用的。
为什么这很重要
它表明你对单元测试中的方法有所了解。你提到避免使用猴子补丁会表明你不是那些喜欢花哨的代码而不喜欢可维护代码的程序员(他们就在那里,而且合作起来会非常糟糕)。它表明你对Python如何在较低层次上工作,如何实际存储和调用函数等有所了解。
这是什么东西的意思是:*args,**kwargs?我们为什么要用它呢?
回答
当我们不确定要向函数传递多少参数时,或者我们想向函数传递已存储的列表或参数元组时使用*args。**kwargs用于当我们不知道将多少关键字参数传递给函数时,或者它可以用用于关键字参数传递字典的值。标识符args和kwargs是一种约定,你也可以使用*bob,**billy但这不是明智的。
这是一个小示例:
def f(*args,**kwargs): print(args, kwargs)
l = [1,2,3]
t = (4,5,6)
d = {'a':7,'b':8,'c':9}
f()
f(1,2,3) # (1, 2, 3) {}
f(1,2,3,"groovy") # (1, 2, 3, 'groovy') {}
f(a=1,b=2,c=3) # () {'a': 1, 'c': 3, 'b': 2}
f(a=1,b=2,c=3,zzz="hi") # () {'a': 1, 'c': 3, 'b': 2, 'zzz': 'hi'}
f(1,2,3,a=1,b=2,c=3) # (1, 2, 3) {'a': 1, 'c': 3, 'b': 2}
f(*l,**d) # (1, 2, 3) {'a': 7, 'c': 9, 'b': 8}
f(*t,**d) # (4, 5, 6) {'a': 7, 'c': 9, 'b': 8}
f(1,2,*t) # (1, 2, 4, 5, 6) {}
f(q="winning",**d) # () {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}
f(1,2,*t,q="winning",**d) # (1, 2, 4, 5, 6) {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}
def f2(arg1,arg2,*args,**kwargs): print(arg1,arg2, args, kwargs)
f2(1,2,3) # 1 2 (3,) {}
f2(1,2,3,"groovy") # 1 2 (3, 'groovy') {}
f2(arg1=1,arg2=2,c=3) # 1 2 () {'c': 3}
f2(arg1=1,arg2=2,c=3,zzz="hi") # 1 2 () {'c': 3, 'zzz': 'hi'}
f2(1,2,3,a=1,b=2,c=3) # 1 2 (3,) {'a': 1, 'c': 3, 'b': 2}
f2(*l,**d) # 1 2 (3,) {'a': 7, 'c': 9, 'b': 8}
f2(*t,**d) # 4 5 (6,) {'a': 7, 'c': 9, 'b': 8}
f2(1,2,*t) # 1 2 (4, 5, 6) {}
f2(1,1,q="winning",**d) # 1 1 () {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}
f2(1,2,*t,q="winning",**d) # 1 2 (4, 5, 6) {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}
为什么关心?
有时我们需要将未知数量的参数或关键字参数传递给函数。有时我们会想要存储参数或关键字参数供以后使用。有时它只是节省时间。
这些对你来说意味着:@classmethod,@staticmethod,@property?
回答背景知识
这些是装饰者。装饰器是一种特殊的函数,它既可以获取函数并可以返回一个函数,或者获取一个类并返回一个类。该@符号只是语法糖,允许你以一种易于阅读的方式装饰一些东西。
@my_decorator
def my_func(stuff):
do_things
相当于
def my_func(stuff):
do_things
my_func = my_decorator(my_func)
实际答案
装饰器@classmethod,@staticmethod和@property是在类中定义的函数的时候使用。以下是他们的行为方式:
class MyClass(object):
def __init__(self):
self._some_property = "properties are nice"
self._some_other_property = "VERY nice"
def normal_method(*args,**kwargs):
print("calling normal_method({0},{1})".format(args,kwargs))
@classmethod
def class_method(*args,**kwargs):
print("calling class_method({0},{1})".format(args,kwargs))
@staticmethod
def static_method(*args,**kwargs):
print("calling static_method({0},{1})".format(args,kwargs))
@property
def some_property(self,*args,**kwargs):
print("calling some_property getter({0},{1},{2})".format(self,args,kwargs))
return self._some_property
@some_property.setter
def some_property(self,*args,**kwargs):
print("calling some_property setter({0},{1},{2})".format(self,args,kwargs))
self._some_property = args[0]
@property
def some_other_property(self,*args,**kwargs):
print("calling some_other_property getter({0},{1},{2})".format(self,args,kwargs))
return self._some_other_property
o = MyClass()
#未修饰方法的工作原理与普通方法一样,它们将当前实例(self)作为第一个参数
o.normal_method
#
o.normal_method()
# normal_method((<__main__.MyClass instance at 0x7fdd2537ea28>,),{})
o.normal_method(1,2,x=3,y=4)
# normal_method((<__main__.MyClass instance at 0x7fdd2537ea28>, 1, 2),{'y': 4, 'x': 3})
# class methods always get the class as the first argument
o.class_method
#
o.class_method()
# class_method((
o.class_method(1,2,x=3,y=4)
# class_method((
# static methods have no arguments except the ones you pass in when you call them
o.static_method
#
o.static_method()
# static_method((),{})
o.static_method(1,2,x=3,y=4)
# static_method((1, 2),{'y': 4, 'x': 3})
# properties are a way of implementing getters and setters. It's an error to explicitly call them
# "read only" attributes can be specified by creating a getter without a setter (as in some_other_property)
o.some_property
# calling some_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})
# 'properties are nice'
o.some_property()
# calling some_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})
# Traceback (most recent call last):
# File "", line 1, in
# TypeError: 'str' object is not callable
o.some_other_property
# calling some_other_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})
# 'VERY nice'
# o.some_other_property()
# calling some_other_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})
# Traceback (most recent call last):
# File "", line 1, in
# TypeError: 'str' object is not callable
o.some_property = "groovy"
# calling some_property setter(<__main__.MyClass object at 0x7fb2b7077890>,('groovy',),{})
o.some_property
# calling some_property getter(<__main__.MyClass object at 0x7fb2b7077890>,(),{})
# 'groovy'
o.some_other_property = "very groovy"
# Traceback (most recent call last):
# File "", line 1, in
# AttributeError: can't set attribute
o.some_other_property
# calling some_other_property getter(<__main__.MyClass object at 0x7fb2b7077890>,(),{})
# 'VERY nice'
想想下面这串代码,它将输出什么?
class A(object):
def go(self):
print("go A go!")
def stop(self):
print("stop A stop!")
def pause(self):
raise Exception("Not Implemented")
class B(A):
def go(self):
super(B, self).go()
print("go B go!")
class C(A):
def go(self):
super(C, self).go()
print("go C go!")
def stop(self):
super(C, self).stop()
print("stop C stop!")
class D(B,C):
def go(self):
super(D, self).go()
print("go D go!")
def stop(self):
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08