CDA持证人阿涛哥

2023-11-21   阅读量: 4188

数据分析师 Python

CDA学习 python的驻留机制

扫码加入数据分析学习群

如今有几种不同的 Python 解释器,包括 CPython、Jython、IronPython 等。我们现在讨论的优化技术是跟 CPython 这种标准的 Python 解释器有关的。

驻留机制

Interning(驻留机制)是指根据需要重用对象 ,而不是创建新对象。我们通过一些例子来理解 Integer 类型对象和 String 类型对象的驻留机制。

is - is 是一种运算符,用于比较两个 Python 对象的内存位置。

id - id 用于获取对象的十进制形式的内存位置。

Integer 对象的驻留

Python 启动之时在内存中预加载了一系列 Integer 对象,这些对象是从 -5 到 256 之间的数字。我们无论何时创建的该范围内的 Integer 对象都会自动指向这些预先加载的内存位置,Python 不会因此创建新的对象。

使用这样的优化策略的原因很简单,是由于 -5 到 256 范围内的数字经常会用到。把它们预存在内存中是有实际意义的。所以,Python 在启动之时把它们预加载到内存里面使得运行速度和内存得到优化。

例 1

本例中,变量 a 和变量 b 都被赋值 100。由于 100 是 -5 到 256 范围内的数值,Python 会使用驻留的对象,变量 b 也会指向同一内存位置,而不会创建另一个值为 100 的对象。

Image by Author

从下面的代码可以看出,变量 a 和变量 b 指向的是内存中同一对象。Python 不会为变量 b 创建新的对象,而是指向了变量 a 的内存位置。这是由于 Integer 对象的驻留机制决定的。

Image by Author

例 2

本例中,变量 a 和变量 b 都被赋值 1000。由于 1000 不在 -5 到 256 范围内,Python 会创建两个 Integer 对象。所以变量 a 和变量 b 的存储位置就不一样了。

Image by Author

从下面的代码可以看出,变量 a 和变量 b 在内存中的存储位置是不同的。

Image by Author

String 对象的驻留

跟 Integer 对象一样,某些 String 对象也是驻留的。一般来说,任何符合标识符命名规范的 String 对象都是驻留的。有时也存在例外,所以不要完全依赖于驻留机制。

例 1

字符串 “Data” 是合法的标识符,它会驻留,所以两个变量都指向同一内存位置。

Image by Author

例 2

字符串 “Data Science” 不是合法的标识符,驻留机制无效,所以两个变量指向不同的内存位置。

Image by Author

上述例子都来自 Google Colab,使用的 Python 版本是 3.6.9。

在 Python 3.6 中,所有合法的、长度不大于 20 的字符串都是驻留的。但在 Python 3.7 中,长度上限变为 4096。所以正如我以前提到的,这些标准因 Python 版本而异。

由于不是所有的 String 对象都被驻留,Python 提供了强制驻留字符串的方法 sys.intern()。这个方法除非确实需要,否则不建议使用。使用方法参考下面的代码。

Image by Author

String 对象驻留的重要意义

假定在你的应用程序中,会频繁进行字符串操作。如果使用 == 运算符来比较长度较大的字符串,Python 会一个个字符去比较,这显然是费时的。但如果这些长字符串被驻留,它们就指向了相同的内存位置。由于比较内存位置的操作会快得多,我们就可以使用 is 运算符来进行字符串比较。



添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子