除使用索引来访问单个元素外,还可使用切片(slicing)来访问特定范围内的元素。为此, 可使用两个索引,并用冒号分隔:
>>> tag = '<a href="http://www.python.org">Python web site</a>'
>>> tag[9:30] 'http://www.python.org'
>>> tag[32:-4]
'Python web site'
如你所见,切片适用于提取序列的一部分,其中的编号非常重要:第一个索引是包含的第一 个元素的编号,但第二个索引是切片后余下的第一个元素的编号。请看下面的示例:
>>> numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] >>> numbers[3:6] [4, 5, 6] >>> numbers[0:1] [1]
简而言之,你提供两个索引来指定切片的边界,其中第一个索引指定的元素包含在切片内, 但第二个索引指定的元素不包含在切片内。
1. 绝妙的简写 假设你要访问前述数字列表中的后三个元素,显然可以明确地指定这一点。
>>> numbers[7:10] [8, 9, 10]
在这里,索引10指的是第11个元素:它并不存在,但确实是到达后一个元素后再前进一步 所处的位置。明白了吗?如果要从列表末尾开始数,可使用负数索引。
>>> numbers[-3:-1] [8, 9]
然而,这样好像无法包含后一个元素。如果使用索引0,即到达列表末尾后再前进一步所 处的位置,结果将如何呢?
>>> numbers[-3:0] []
结果并不是你想要的。事实上,执行切片操作时,如果第一个索引指定的元素位于第二个索 引指定的元素后面(在这里,倒数第3个元素位于第1个元素后面),结果就为空序列。好在你能 使用一种简写:如果切片结束于序列末尾,可省略第二个索引。
>>> numbers[-3:] [8, 9, 10]
同样,如果切片始于序列开头,可省略第一个索引。
>>> numbers[:3] [1, 2, 3]
实际上,要复制整个序列,可将两个索引都省略。
>>> numbers[:] [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
切片操作示例
# 从类似于http://www.something.com的URL中提取域名
url = input('Please enter the URL:') domain = url[11:-4]
print("Domain name: " + domain)
这个程序的运行情况类似于下面这样:
Please enter the URL: http://www.python.org Domain name: python
2. 更大的步长 执行切片操作时,你显式或隐式地指定起点和终点,但通常省略另一个参数,即步长。在普 通切片中,步长为1。这意味着从一个元素移到下一个元素,因此切片包含起点和终点之间的所 有元素。
>>> numbers[0:10:1] [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
在这个示例中,指定了另一个数。你可能猜到了,这显式地指定了步长。如果指定的步长大 于1,将跳过一些元素。例如,步长为2时,将从起点和终点之间每隔一个元素提取一个元素。
>>> numbers[0:10:2] [1, 3, 5, 7, 9] numbers[3:6:3] [4]
显式地指定步长时,也可使用前述简写。例如,要从序列中每隔3个元素提取1个,只需提供 步长4即可。
>>> numbers[::4] [1, 5, 9]
当然,步长不能为0,否则无法向前移动,但可以为负数,即从右向左提取元素。
>>> numbers[8:3:-1] [9, 8, 7, 6, 5]
>>> numbers[10:0:-2] [10, 8, 6, 4, 2]
>>> numbers[0:10:-2] []
>>> numbers[::-2] [10, 8, 6, 4, 2]
>>> numbers[5::-2] [6, 4, 2]
>>> numbers[:5:-2] [10, 8]
在这种情况下,要正确地提取颇费思量。如你所见,第一个索引依然包含在内,而第二个索 引不包含在内。步长为负数时,第一个索引必须比第二个索引大。可能有点令人迷惑的是,当你 省略起始和结束索引时,Python竟然执行了正确的操作:步长为正数时,它从起点移到终点,而 步长为负数时,它从终点移到起点。
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar