热线电话：13121318867

首页精彩阅读抽丝剥茧，深入剖析 Python 如何实现变量交换（CDA干货分享）

抽丝剥茧，深入剖析 Python 如何实现变量交换（CDA干货分享）

2022-01-19

作者：大奎

来源：早起Python

Python 程序员肯定知道 a,b = b,a，这句话用来交换两个变量。相较于其它语言需要引入一个 temp 来临时存储变量的做法，Python 的这种写法无疑非常优雅。

佶屈聱牙的 C 写法：

int a = 1; int b = 2; int temp; temp = a; a = b; b = temp;

简洁优雅的 Python 写法：

a,b = 1,2 a,b = b,a

虽然语法非常方便，但我们始终不曾想过：它是怎么运作的？背后支撑它的机制是什么？下面让我们一步步分析它。

通俗的说法

最常见的解释是：

a,b = b,a 中右侧是元组表达式，即 b,a 是一个两个元素的 tuple(a,b)。表达式左侧是两个待分配元素，而 = 相当于元组元素拆包赋值操作。

这种方法，理解起来最简单，但实际是这种情况么？

让我们从字节码上看下，是不是这种情况。

从字节码一窥交换变量

大家可能不太了解 Python 字节码。Python 解释器是一个基于栈的虚拟机。Python 解释器就是编译、解释 Python 代码的二进制程序。

虚拟机是一种执行代码的容器，相较于二进制代码具有方便移植的特点。而 Python 的虚拟机就是栈机器。

Python 中函数调用、变量赋值等操作，最后都转换为对栈的操作。这些对栈的具体操作，就保存在字节码里。

dis 模块可以反编译字节码，使其变成人类可读的栈机器指令。如下，我们看反编译 a,b=b,a 的代码。

>>> import dis >>> dis.dis("a,b=b,a") 1 0 LOAD_NAME 0 (b) 2 LOAD_NAME 1 (a) 4 ROT_TWO 6 STORE_NAME 1 (a) 8 STORE_NAME 0 (b) 10 LOAD_CONST 0 (None) 12 RETURN_VALUE

可见，在 Python 虚拟机的栈上，我们按照表达式右侧的 b,a 的顺序，先后压入计算栈中，然后用一个重要指令 ROT_TWO，这个操作交换了 a 和 b 的位置，最后 STORE_NAME 操作将栈顶的两个元素先后弹出，传递给 a 和 b 元素。

栈的特性是先进后出（FILO）。当我们按b,a顺序压入栈的时候，弹出时先出的就是a,再弹出就是b。STORE_NAME指令会把栈顶元素弹出，并关联到相应变量上。

如果没有第 4 列的指令 ROT_TWO，此次 STORE_NAME 弹出的第一个变量会是后压栈的 a，这样就是 a=a 的效果。有了 ROT_TWO 则完成了变量的交换。

好了，我们知道靠压栈、弹栈和交换栈顶的两个元素，实现了 a,b = b,a 的操作。

同时，我们也知道了，上诉元组拆包赋值的说法，是不恰当的。

那 ROT_TWO 是怎么具体操作的呢？

后台怎么执行？

见名知意，可以猜出来 ROT_TWO 是交换两个栈顶变量的操作。在 Python 源代码的层面上，来看是如何交换两个栈顶的元素。

下载 Python 源代码，进入 Python/ceval.c 文件，在 1101 行，我们看到了 ROT_TWO 的操作。

TARGET(ROT_TWO){ PyObject *top = TOP(); PyObject *second = SECOND(); SET_TOP(second); SET_SECOND(top); FAST_DISPATCH();  }

代码比较简单，我们用 TOP 和 SECOND 宏获取了栈上的 a,b 元素，然后再用 SET_TOP、SET_SECOND 宏把值写入栈中。以此完成交换栈顶元素的操作。

求值顺序的奇怪现象！

下面，我们来看一个奇怪的现象，在这篇文章里，也可以看到这个现象。如下，我们试图排序这个列表：

>>> a = [0, 1, 3, 2, 4] >>> a[a[2]], a[2] = a[2], a[a[2]] >>> a >>> [0, 1, 2, 3, 4] >>> a = [0, 1, 3, 2, 4] >>> a[2], a[a[2]] = a[a[2]],a[2] >>> a >>> [0, 1, 3, 3, 4]

按照理解 a,b = b,a 和 b,a=a,b 是一样的结果，但从上例中我们看到，这两者的结果是不同的。

导致这一现象的原因在于：求值的顺序。毫无疑问，整个表达式先求右侧的两个元素，然后作为常数保存起来。最后赋值给左侧的两个变量。

最后赋值时，需要注意，我们从左到右依次赋值，如果 a[2] 先修改的话，势必会影响到其后的 a[a[2]] 的列表下标。

“

你可以使用反汇编代码，来分析产生这个现象的具体步骤。

”

奇怪的变回拆包现象！！

当我们使用常数作为右侧元组，来给左侧变量赋值时；或使用超过三个元素，来完成便捷交换时，其在字节码层次上便不是 ROT_TWO 这种操作了。

>>> dis.dis("a,b,c,d=b,c,d,a") 1 0 LOAD_NAME 3 LOAD_NAME 6 LOAD_NAME 9 LOAD_NAME 12 BUILD_TUPLE 15 UNPACK_SEQUENCE 18 STORE_NAME 21 STORE_NAME 24 STORE_NAME 27 STORE_NAME 30 LOAD_CONST 33 RETURN_VALUE >>>

很明显，这里是在偏移 12 字节处 BUILD_TUPLE 组装元组，然后解包赋值给左侧变量。上文所述的通俗说法，在这里又成立了！

也就是说，当小于四个元素交换时，Python 采用优化的栈操作来完成交换。

当使用常量或者超过四个元素时，采用元组拆包赋值的方式来交换。

至于为什么是四个元素，应该是因为 Python 最多支持到 ROT_THREE 操作，四个元素的话，系统不知道该怎么优化了。但在新版本的 Python 中，我看到了 ROT_FOUR 操作，所以这时候，四个元素还是 ROT_* 操作来优化的。

>>>import opcode >>>opcode.opmap["ROT_THREE"] 3

此例中，该版本 Python 支持 ROT_THREE 操作，你也可以使用 ROT_FOUR 查看自己 Python 是否支持，进而确定是否可以四个以上元素便捷交换。

总结

综上，我们了解了 Python 中优雅的 a,b = b,a 交换变量方法的实现和运行原理，深入了解其求值顺序和局限性，同时学习了深入分析 Python 代码的思路和方法，如果对你有帮助，可以给本文点个赞，也欢迎分享出去让更多人看见！

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

虚拟机

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇干货 | 如何避免输出没用的数据分析结果（CDA干货分享）

下一篇用Python可视化分析全球火山分布，发现了这些有趣的现象（CDA干货分享）

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

抽丝剥茧，深入剖析 Python 如何实现变量交换（CDA干货分享）

通俗的说法

从字节码一窥交换变量

后台怎么执行？

求值顺序的奇怪现象！

奇怪的变回拆包现象！！

总结

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

从“杂乱信号”到“有序资产”：CDA数据分析师视角 ...

CDA持证人专访：周婧博谈会计行业数据分析与经营诊 ...

【CDA干货】问卷调查卡方检验：原理、前提与实战应 ...

从“整体波动”到“因子归因”：CDA数据分析师视角 ...

【CDA干货】单因素方差分析：三组及以上独立样本的 ...

【CDA干货】次日付费留存计算方法、统计口径与业务 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载