热线电话：13121318867

职场经验之15个你必须知道的Python面试题

2019-07-04

介绍

随着人工智能、机器学习、深度学习的发展，这个领域也正在不断的进入人们的眼帘，并且带来了很多、很大的工作机会，随着这些机会的诞生，Python在这个机会中也在不断的发展壮大，因为Python不像其他语言一样复杂，Python简单易学容易被人们接受。并且这并不是我一个人在这里瞎说就可以证明的，在2019年6月PYPL流行程序设计语言中，Python排在第一位占到了28.08%，是第二名Java和第三名Javascript的和,并且还在不断的上涨中。

而且在另外一个编程语言TIOBE指数排行榜中，Python排在了第三位，排在第一位和第二位的是Java和C语言。并且排行榜还预测认为Python会在3-4年取代C和Java，而原因是软件工程行业正在不断的蓬勃发展，吸引了很多新人进入该领域，Java和C对于初学者来说一些困难，而Python相对于这两种语言来说，太过于简单了。

站在这里，我认为现在正在看这篇文章的你想要找一份有关于Python的工作，不然你也不会点进来不是，你可能是一个Python的初学者，或者说已经在Python工作岗位上已经工作过了，但是如果你还需要找一份Python的工作的话，你可能需要证明你知道如何使用Python。以下是一些涉及与Python相关的基础技能的问题。重点放在语言本身，而不是任何特定的包或框架。

某种程度上来说，我还没有遇到过这么难的面试，如果你能轻松的答对这些问题，找到正确的答案，那么就快去找份工作吧。

本教程不是固定指南

本教程不打算涵盖所有的工作场所因为不同的雇主会以不同的方式向你提出不同的问题; 他们会有各自的习惯; 他们重视的内容也是不同的。他们会以不同的方式测试你。有些老板会让你坐在电脑前，要求你解决简单的问题; 有些会让你在白板前站起来做类似的事; 有些人会给你一个需要让你回家解决的问题，方便节省他们的时间;而还有些人会和你谈谈。

而对程序员的最佳测试实际上就是编程。使用简单的教程测试是一件困难的事情。因此，为了面试过程中的加分，请确保你真的掌握了解决问题的方法。如果你真的很明白这些方法，那么你就可以利用解决问题的方法，使你获得胜利。

同样的，对于软件工程师的最有效的测试实际上是工程学。本教程是关于Python作为一种语言。能够设计高效，有效，可维护的类层次结构来解决小众问题是非常了不起的，并且是一项值得追求的技能，但是这就超出了本文的范围。

本教程不符合PEP8标准。这是有意的，因为如前所述，不同的老板将遵循不同的习惯。你需要适应公司的文化。因为实用性胜过一切。

本教程另一个不足之处是不够简洁。我不想只是向你提出问题和答案，而是希望有些事情可以解决。我希望你能够理解，或者至少理解的足够好，这样你们对任何有问题的话题能够进一步的去解释

问题1

Python到底是什么，你可以在回答中与其他技术进行比较（加分项）。

回答

以下是几个要点：

Python是一种解释型语言。这意味着，与C语言及其变体等语言不同，Python不需要在运行之前进行编译。其他解释语言包括PHP和Ruby。
Python是动态类型的，这意味着当你声明变量或类似的变量时，你不需要声明变量的类型。你可以做先一些事情如：x=111，然后再将x="I'm a string"这样并没有错误
Python非常适合面向对象的编程，因为它允许类的定义以及组合和继承。Python没有访问修饰符（如C ++的public，private），对于这一点的理由是因为‘我们都是成年人’
在Python中，函数也是一个类对象。这意味着可以将它们分配给变量，从其他函数返回并传递给函数。类也是一个类对象
编写Python代码可以很快，但运行它通常比编译语言慢。但幸运的是，Python允许包含基于C的扩展，因此瓶颈可以被优化掉并且可以经常被优化。这个numpy包就是一个很好的例子，它真的非常快，因为它处理的很多数字运算实际上并不是由Python完成的
Python可用于许多领域 - Web应用程序，自动化，科学建模，大数据应用程序等等。它也经常被用作“粘合”代码，以使其他语言和组件发挥得很好。
Python使得困难的事情变得容易，因此程序员可以专注于重写算法和结构，而不是关注底层的低级细节。

为什么这很重要：

如果你正在申请的是Python职位，你应该知道它是什么以及为什么它如此酷。

问题2

填写遗漏的代码：

def print_directory_contents(sPath):

"""

这个函数接受一个目录的名称

并且打印该目录中的路径文件

这个函数类似于os.walk。

但是请不要使用这个模块系统。

输入你的答案

我们对你使用嵌套结构的能力很感兴趣

"""

fill_this_in

回答

def print_directory_contents(sPath):

import os

for sChild in os.listdir(sPath):

sChildPath = os.path.join(sPath,sChild)

if os.path.isdir(sChildPath):

print_directory_contents(sChildPath)

else:

print(sChildPath)

特别注意

与你的命名约定保持一致。如果在任何示例代码中都有明显的命名约定，请坚持下去。即使它不是你通常使用的命名约定
递归函数需要递归和终止。确认你真的了解这是如何发生的，这样你就可以避免无底的调用堆栈
我们使用该os模块以跨平台的方式与操作系统进行交互。你可以说，sChildPath = sPath + '/' + sChild但这不适用于Windows
熟悉基本的软件包是非常值得的，但是不要为了记住所有的东西而头痛，百度or谷歌是你在工作中遇到需要包的问题的时候的朋友！
如果你不理解代码应该做什么，请提出问题
保持简单，笨蛋！

为什么这很重要：

显示你的基本操作系统交互内容方面的知识
递归是非常有用的

问题3

查看下面的代码，写下A0，A1，...An的最终值。

A0 = dict(zip(('a','b','c','d','e'),(1,2,3,4,5)))

A1 = range(10)

A2 = sorted([i for i in A1 if i in A0])

A3 = sorted([A0[s] for s in A0])

A4 = [i for i in A1 if i in A3]

A5 = {i:i*i for i in A1}

A6 = [[i,i*i] for i in A1]

如果你不知道什么是zip那么不用紧张。没有一个理智的雇主会要求你熟记标准库。这是help(zip)的输出。

zip(...)

zip(seq1 [, seq2 [...]]) -> [(seq1[0], seq2[0] ...), (...)]

Return a list of tuples, where each tuple contains the i-th element

from each of the argument sequences. The returned list is truncated

in length to the length of the shortest argument sequence.

如果这没有任何意义，那么就请你花几分钟去想清楚你要选择的方式。

回答

A0 = {'a': 1, 'c': 3, 'b': 2, 'e': 5, 'd': 4} # the order may vary

A1 = range(0, 10) # or [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] in python 2

A2 = []

A3 = [1, 2, 3, 4, 5]

A4 = [1, 2, 3, 4, 5]

A5 = {0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}

A6 = [[0, 0], [1, 1], [2, 4], [3, 9], [4, 16], [5, 25], [6, 36], [7, 49], [8, 64], [9, 81]]

为什么这很重要

对于很多人来说，理解列表是一个很好的节省时间的方法，当然也是一个巨大的绊脚石
如果你能读懂它们，那么你也可以写下来
这些代码中的一部分是故意设计的很奇怪的。因为你可能需要在工作中与一些奇怪的人合作

问题4

多线程使用Python。这是个好主意吗？列出一些方法可以让一些Python代码以并行方式运行。

回答

Python不允许真正意义上的多线程。它有一个多线程包，但如果你想使用多线程来加速你的代码，那么使用它通常不是一个好主意。Python有一个名为全局解释器锁(Global Interpreter Lock（GIL）)的结构。GIL确保每次只能执行一个“线程”。一个线程获取GIL，做一点工作，然后将GIL传递到下一个线程。这种情况发生的很快，因此对于人眼看来，你的线程似乎是并行运行的，但它们实际上只是轮流使用相同的CPU核心。所有这些GIL传递都增加了运行的内存。这意味着如果你想让代码运行得更快，那么使用线程包通常不是一个好主意。

使用Python的线程包也是有原因的。如果你想同时运行一些东西，并且效率不是一个问题，那么它就完全没问题了。或者，如果你正在运行需要等待某些事情的代码（例如某些IO），那么它可能会很有意义。但是线程库不会让你使用额外的CPU核心。

多线程可以外包到操作系统（通过多处理），一些调用Python代码的外部应用程序（例如，Spark或Hadoop），或者Python代码调用的一些代码例如：你可以使用你的Python代码调用一个C函数来完成昂贵的多线程事务。

为什么这很重要

因为GIL是一个A-hole。在学习GIL之前，很多人花了很多的时间在他们的Python多线程中遇到了瓶颈。

问题5

如何跟踪代码的不同版本？

回答：

版本控制！此时，你应该表现的非常兴奋，并告诉他们你如何使用Git（或任何你最喜欢的）来跟踪与Granny的通信。Git是我首选的版本控制系统，但还有其他版本控制系统，例如subversion。

为什么这很重要：

因为没有版本控制的代码就像没有杯子的咖啡。有时我们需要编写一次性丢弃的脚本，这没关系，但是如果你正在处理大量的代码，版本控制系统将是一个优势。版本控制有助于跟踪谁对代码库进行了哪些更改; 找出Bug是什么时候引入代码的; 跟踪软件的版本和发布版本; 在团队成员之间分发源代码; 部署和某些自动化。它允许你在破坏代码之前将代码转回到自己的代码之上。等等很多东西。这太棒了。

问题6

这段代码输出了什么：

def f(x,l=[]):

for i in range(x):

l.append(i*i)

print(l)

f(2)

f(3,[3,2,1])

f(3)

回答

[0, 1]

[3, 2, 1, 0, 1, 4]

[0, 1, 0, 1, 4]

为什么重要？

第一个函数调用应该相当明显，循环将0和1附加到空列表中l.l是指向存储在内存中的列表的变量的名称。第二个调用通过在新的内存块中创建新列表开始。l然后指向这个新列表。然后它将0,1和4附加到这个新列表中。这太好了。第三个函数调用是奇怪的。它使用存储在原始内存块中的原始列表。这就是它从0和1开始的原因。

如果你不明白，试试这个：

l_mem = []

l = l_mem # the first call

for i in range(2):

l.append(i*i)

print(l) # [0, 1]

l = [3,2,1] # the second call

for i in range(3):

l.append(i*i)

print(l) # [3, 2, 1, 0, 1, 4]

l = l_mem # the third call

for i in range(3):

l.append(i*i)

print(l) # [0, 1, 0, 1, 4]

问题7

什么是猴子补丁？，这是个好主意吗？

回答

猴子补丁是在定义函数或对象已经定义后进行更改的行为。例如：

import datetime

datetime.datetime.now = lambda: datetime.datetime(2012, 12, 12)

大多数时候，这是一个非常糟糕的想法 - 如果事情以明确的方式运行，通常是最好的。猴子补丁的一个原因是测试。该模拟包对此还是非常有用的。

为什么这很重要

它表明你对单元测试中的方法有所了解。你提到避免使用猴子补丁会表明你不是那些喜欢花哨的代码而不喜欢可维护代码的程序员（他们就在那里，而且合作起来会非常糟糕）。它表明你对Python如何在较低层次上工作，如何实际存储和调用函数等有所了解。

问题8

这是什么东西的意思是：*args，**kwargs？我们为什么要用它呢？

回答

当我们不确定要向函数传递多少参数时，或者我们想向函数传递已存储的列表或参数元组时使用*args。**kwargs用于当我们不知道将多少关键字参数传递给函数时，或者它可以用用于关键字参数传递字典的值。标识符args和kwargs是一种约定，你也可以使用*bob，**billy但这不是明智的。

这是一个小示例：

def f(*args,**kwargs): print(args, kwargs)

l = [1,2,3]

t = (4,5,6)

d = {'a':7,'b':8,'c':9}

f()

f(1,2,3) # (1, 2, 3) {}

f(1,2,3,"groovy") # (1, 2, 3, 'groovy') {}

f(a=1,b=2,c=3) # () {'a': 1, 'c': 3, 'b': 2}

f(a=1,b=2,c=3,zzz="hi") # () {'a': 1, 'c': 3, 'b': 2, 'zzz': 'hi'}

f(1,2,3,a=1,b=2,c=3) # (1, 2, 3) {'a': 1, 'c': 3, 'b': 2}

f(*l,**d) # (1, 2, 3) {'a': 7, 'c': 9, 'b': 8}

f(*t,**d) # (4, 5, 6) {'a': 7, 'c': 9, 'b': 8}

f(1,2,*t) # (1, 2, 4, 5, 6) {}

f(q="winning",**d) # () {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}

f(1,2,*t,q="winning",**d) # (1, 2, 4, 5, 6) {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}

def f2(arg1,arg2,*args,**kwargs): print(arg1,arg2, args, kwargs)

f2(1,2,3) # 1 2 (3,) {}

f2(1,2,3,"groovy") # 1 2 (3, 'groovy') {}

f2(arg1=1,arg2=2,c=3) # 1 2 () {'c': 3}

f2(arg1=1,arg2=2,c=3,zzz="hi") # 1 2 () {'c': 3, 'zzz': 'hi'}

f2(1,2,3,a=1,b=2,c=3) # 1 2 (3,) {'a': 1, 'c': 3, 'b': 2}

f2(*l,**d) # 1 2 (3,) {'a': 7, 'c': 9, 'b': 8}

f2(*t,**d) # 4 5 (6,) {'a': 7, 'c': 9, 'b': 8}

f2(1,2,*t) # 1 2 (4, 5, 6) {}

f2(1,1,q="winning",**d) # 1 1 () {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}

f2(1,2,*t,q="winning",**d) # 1 2 (4, 5, 6) {'a': 7, 'q': 'winning', 'c': 9, 'b': 8}

为什么关心？

有时我们需要将未知数量的参数或关键字参数传递给函数。有时我们会想要存储参数或关键字参数供以后使用。有时它只是节省时间。

问题9

这些对你来说意味着：@classmethod，@staticmethod，@property？

回答背景知识

这些是装饰者。装饰器是一种特殊的函数，它既可以获取函数并可以返回一个函数，或者获取一个类并返回一个类。该@符号只是语法糖，允许你以一种易于阅读的方式装饰一些东西。

@my_decorator

def my_func(stuff):

do_things

相当于

def my_func(stuff):

do_things

my_func = my_decorator(my_func)

实际答案

装饰器@classmethod，@staticmethod和@property是在类中定义的函数的时候使用。以下是他们的行为方式：

class MyClass(object):

def __init__(self):

self._some_property = "properties are nice"

self._some_other_property = "VERY nice"

def normal_method(*args,**kwargs):

print("calling normal_method({0},{1})".format(args,kwargs))

@classmethod

def class_method(*args,**kwargs):

print("calling class_method({0},{1})".format(args,kwargs))

@staticmethod

def static_method(*args,**kwargs):

print("calling static_method({0},{1})".format(args,kwargs))

@property

def some_property(self,*args,**kwargs):

print("calling some_property getter({0},{1},{2})".format(self,args,kwargs))

return self._some_property

@some_property.setter

def some_property(self,*args,**kwargs):

print("calling some_property setter({0},{1},{2})".format(self,args,kwargs))

self._some_property = args[0]

@property

def some_other_property(self,*args,**kwargs):

print("calling some_other_property getter({0},{1},{2})".format(self,args,kwargs))

return self._some_other_property

o = MyClass()

#未修饰方法的工作原理与普通方法一样，它们将当前实例(self)作为第一个参数

o.normal_method

# >

o.normal_method()

# normal_method((<__main__.MyClass instance at 0x7fdd2537ea28>,),{})

o.normal_method(1,2,x=3,y=4)

# normal_method((<__main__.MyClass instance at 0x7fdd2537ea28>, 1, 2),{'y': 4, 'x': 3})

# class methods always get the class as the first argument

o.class_method

# >

o.class_method()

# class_method((,),{})

o.class_method(1,2,x=3,y=4)

# class_method((, 1, 2),{'y': 4, 'x': 3})

# static methods have no arguments except the ones you pass in when you call them

o.static_method

o.static_method()

# static_method((),{})

o.static_method(1,2,x=3,y=4)

# static_method((1, 2),{'y': 4, 'x': 3})

# properties are a way of implementing getters and setters. It's an error to explicitly call them

# "read only" attributes can be specified by creating a getter without a setter (as in some_other_property)

o.some_property

# calling some_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})

# 'properties are nice'

o.some_property()

# calling some_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})

# Traceback (most recent call last):

# File "", line 1, in

# TypeError: 'str' object is not callable

o.some_other_property

# calling some_other_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})

# 'VERY nice'

# o.some_other_property()

# calling some_other_property getter(<__main__.MyClass instance at 0x7fb2b70877e8>,(),{})

# Traceback (most recent call last):

# File "", line 1, in

# TypeError: 'str' object is not callable

o.some_property = "groovy"

# calling some_property setter(<__main__.MyClass object at 0x7fb2b7077890>,('groovy',),{})

o.some_property

# calling some_property getter(<__main__.MyClass object at 0x7fb2b7077890>,(),{})

# 'groovy'

o.some_other_property = "very groovy"

# Traceback (most recent call last):

# File "", line 1, in

# AttributeError: can't set attribute

o.some_other_property

# calling some_other_property getter(<__main__.MyClass object at 0x7fb2b7077890>,(),{})

# 'VERY nice'

问题10

想想下面这串代码，它将输出什么？

class A(object):

def go(self):

print("go A go!")

def stop(self):

print("stop A stop!")

def pause(self):

raise Exception("Not Implemented")

class B(A):

def go(self):

super(B, self).go()

print("go B go!")

class C(A):

def go(self):

super(C, self).go()

print("go C go!")

def stop(self):

super(C, self).stop()

print("stop C stop!")

class D(B,C):

def go(self):

super(D, self).go()

print("go D go!")

def stop(self):

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

Hadoop numpy python 机器学习深度学习大数据人工智能

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇上海居民快被垃圾分类逼疯！深度学习技术帮你做到垃圾自动分类

下一篇常用的十大python图像处理工具

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

职场经验之15个你必须知道的Python面试题

介绍

本教程不是固定指南

问题1

问题2

问题3

问题4

问题5

问题6

问题7

问题8

问题9

问题10

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：王晓琳谈数据分析备考与秋招实战经 ...

【CDA干货】用户决策流程全解析：核心环节、影响因 ...

从“标签”到“人”：CDA数据分析师视角下的用户画 ...

【CDA干货】透视表跨表数据应用原理与实战方法 ...

【CDA干货】正态分布异常事件识别与处理方法：数据 ...

从“raw”到“ready”：CDA数据分析师视角下的标签 ...

CDA持证人专访：孙尚亮谈制造行业数据分析与生产采 ...

【CDA干货】DataFrame数据归一化：核心原理、常用方 ...

从“零散标识”到“结构资产”：CDA数据分析师视角 ...

【CDA干货】数据分析如何辅助商业谈判决策：从经验 ...

【CDA干货】T检验完整实操教程：核心原理、分类场景 ...

精准取数之道：CDA数据分析师视角下的数据查询语言 ...

CDA持证人专访：曾津谈互联网数据分析与业务赋能实 ...

【CDA干货】Pandas文本词频统计：查找关键词出现次 ...

从“数据存储”到“智能取数”：CDA数据分析师视角 ...

【CDA干货】CDA透视分析核心计算方法：求和、计数、 ...

【CDA干货】客户交易价值分析：核心逻辑、分析方法 ...

从“数据仓库”到“智能取数”：CDA数据分析师视角 ...

CDA持证人专访：黄冬谈数字化运营核心与数据中台建 ...

【CDA干货】市场调查、竞品分析、需求调研的核心区 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载