Python之旅：第二章-列表和元组

Open kaindy7633 opened this issue 3 years ago • 0 comments

Table of Contents generated with DocToc

Python之旅：第二章列表和元组
- 序列概述
- 通用的序列操作
  - 索引
  - 切片
    - 切片的简写
    - 更大的步长
  - 序列相加
  - 乘法
  - 成员资格
- 列表：Python的主力
  - 函数list
  - 基本的列表操作
    - 修改列表：给元素赋值
    - 删除元素
    - 给切片赋值
  - 列表方法
    - append
    - clear
    - copy
    - count
    - extend
    - index
  - insert
    - pop
    - remove
    - reverse
    - sort
    - 高级排序
- 元组：不可修改的序列

Python之旅：第二章列表和元组

我们先来说说数据结构，数据结构是以某种方式组合起来的数据元素集合。在Python中，最基本的数据结构为序列(Sequence)。序列中的每个元素都有编号，即其位置或索引，其中第一个元素的索引为0，第二个元素的索引为1，依次类推...，同时可回绕到序列末尾，用负索引表示序列末尾元素的位置。

序列概述

Python内置了多种序列，最常用的是列表和元组，另一种重要的序列是字符串。

列表和元组的主要不同在于，列表是可以修改的，而元组不可以，这就意味着列表适用于需要中途添加元素的情景，而元组适用于出于某种考虑而需要禁止修改序列的情景。

在需要处理一系列值时，序列是很有用的。比如在数据库中表示一个人，我们可以使用列表，列表中的每个元素表示人的特征，这些元素放在方括号中，并使用逗号隔开：

>>> edward = ['Edward Gumby', 42] # 包含名字和年龄

一个序列中可以包含其他的序列，因此可以创建一个由序列组成的列表：

>>> edward = ['Edward Gumby', 42]
>>> john = ['John Smith', 50]
>>> database = [edward, john]
>>> database
[['Edward Gumby', 42], ['John Smith', 50]]

注意： Python支持一种数据结构的基本概念，叫做容器(Container)，容器就是可以包含其他对象的对象。Python中有两种主要的容器，一种是序列(如列表和元组),另一种是映射(如字典),在序列中，每个元素都是编号，而在映射中，每个元素都有名称(也叫键),除此之外，还有一种既不是序列也不是映射的容器，它就是集合(Set)。

通用的序列操作

在Python中，对序列的操作包括索引、切片、相加、相乘和成员资格检查，另外，还有一些内置函数，用于确定序列的长度以及找出序列中的最大和最小元素。迭代功能将在后续章节中介绍

索引

序列中的所有元素都有编号，从0开始递增：

>>> greeting = 'Hello'
>>> greeting[0]
'H'

字符串就是由字符组成的序列，索引0指向第一个元素，在Python中没有专门表示字符的类型，因此一个字符就是指包含一个元素的字符串。

我们可以使用索引来获取元素，这种索引方式适用于所有序列，当你使用负数索引时，Python将从右开始往左数，也就是从最后一个元素开始，因此-1是最后一个元素的位置：

>>> greeting[-1]
'o'

我们也可以直接将索引应用到字符串字面量上：

>>> 'Hello'[-1]
'o'

如果函数调用返回一个序列，可直接对其执行索引操作：

>>> fourth = input('Year: ')[3]
Year: 2018
>>> fourth
'8'

下面我们来做一个实例：要求输入年、月、日，再使用相应的月份名将日期打印出来

# 将指定的年、月、日打印出来
months = [
  'January',
  'February',
  'March',
  'April',
  'May',
  'June',
  'August',
  'September',
  'October',
  'November',
  'December'
]

# 一个列表，其中包含数1~31对应的结尾
endings = ['st', 'nd', 'rd'] + 17 * ['th'] \
        + ['st', 'nd', 'rd'] + 7 * ['th'] \
        + ['st']

year = input('Year: ')
month = input('Month (1-12): ')
day = input('Day (1-31): ')

# 类型转换
month_number = int(month)
day_number = int(day)

# 月和日需要-1，这样才能获取正确的索引
month_name = months[month_number - 1]
ordinal = day + endings[day_number - 1]

print(month_name + ' ' + ordinal + ', ' + year)

运行结果如下：

Year: 2018
Month (1-12): 4
Day (1-31): 1
April 1st, 2018

切片

在Python中可以使用切片(slicing)来访问特定范围内的元素，你可以使用两个索引，并用冒号分隔：

>>> tag = '<a href="http://www.python.org">Python web site</a>'
>>> tag[9:30]
'http://www.python.org'
>>> tag[32:-4]
'Python web site'

切片适用于提取序列的一部分，其中编号很重要，第一个索引是包含的第一个元素的编号，但第二个索引是切片后余下的第一个元素的编号

>>> numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
>>> numbers[3:6] 
[4, 5, 6]
>>> numbers[0:1]
[1]

如上的列子可以看出，你需要提供两个索引来指定切片的边界，其中第一个索引指定的元素包含在切片内，但第二个索引指定的元素不包含在切片内。

切片的简写

如果切片结束于序列的末尾，可以省略第二个索引：

>>> numbers[-3:]
[8, 9, 10]

同样的，如果切片始于序列开头，则可以省略第一个索引

>>> numbers[:3]
[1, 2, 3]

所以，如果要复制整个序列，可以将两个索引都省略掉：

>>> numbers[:]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

让我们用切片来做个小示例：

# 从用户输入的url中获取域名
url = input('Please enter the URL: ')
domain = url[11:-4]

print('Domain name: ' + domain)

运行结果如下：

Please enter the URL: http://www.python.org
Domain name: python

更大的步长

前面切片操作都省略了一个参数，即步长，在普通切片中，步长为1，这意味着普通切片操作包含了起点和终点之间的所有元素：

>>> numbers[0:10:1]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

下面我们来显式的指定步长为2，那么将从起点开始，每隔一个元素提取一个元素

>>> numbers[0:10:2]
[1, 3, 5, 7, 9]

显式的指定步长，也可以使用上面的简写，比如要从序列中每隔3个元素提取1个，只需提供步长即可：

>>> numbers[::4]
[1, 5, 9]

步长是不能为0的，否则无法向前移动，但可以为负数，即从右向左提取元素

>>> numbers[8:3:-1]
[9, 8, 7, 6, 5]
>>> numbers[10:0:-2]
[10, 8, 6, 4, 2]
>>> numbers[0:10:-2]
[]

步长为负数时，第一个索引必须比第二个大。

序列相加

在Python中可以使用加法运算来拼接序列

>>> [1, 2, 3] + [4, 5]
[1, 2, 3, 4, 5]
>>> 'Hello ' + 'world!'
'Hello world!'
>>> [1, 2, 3] + 'world!'
Traceback (most recent call last):
  File "<pyshell#12>", line 1, in <module>
    [1, 2, 3] + 'world!'
TypeError: can only concatenate list (not "str") to list

不能拼接列表和字符串，虽然它们都是序列，一般而言，不能拼接不同类型的序列。

乘法

如果将序列与数x相乘，将重复这个序列x次来创建一个新的序列：

>>> 'python' * 5
'pythonpythonpythonpythonpython'
>>> [42] * 10
[42, 42, 42, 42, 42, 42, 42, 42, 42, 42]

空列表是使用不包含任何内容的两个方括号([])表示的。在Python中，使用None表示什么都没有，因此要将列表的长度初始化为10，可以这样做：

>>> sequence = [None] * 10
>>> sequence
[None, None, None, None, None, None, None, None, None, None]

下面我们来看一个例子，使用序列的乘法运行，在屏幕中央打印一个方框

# 在位于屏幕中央且宽度何时的方框内打印一个句子
sentence = input('Sentence: ')

screen_width = 80
text_width = len(sentence)
box_width = text_width + 4
left_margin = (screen_width - box_width) // 2

print()
print(' ' * left_margin + '+' + '-' * (box_width-2) + '+')
print(' ' * left_margin + '| ' + ' ' * text_width + ' |')
print(' ' * left_margin + '| ' + sentence + ' |')
print(' ' * left_margin + '| ' + ' ' * text_width + ' |')
print(' ' * left_margin + '+' + '-' * (box_width-2) + '+')
print()

成员资格

如果我们要检查特定的值是否包含在序列中，可以使用运算符in，它检查是否满足指定的条件，并返回相应的值：满足时返回True，否则返回Flase，这样的运算称为布尔运算

>>> permissions = 'rw'
>>> 'w' in permissions
True
>>> 'x' in permissions
False
>>> users = ['mlh', 'foo', 'bar']
>>> 'mlh' in users
True

下面的示例定义了一个数据列表，需要用户输入后，检查用户输入的是否在列表中

# 检查用户名和PIN码

database = [
    ['albert', '1234'],
    ['dilbert', '4242'],
    ['smith', '7524'],
    ['jones', '9843']
]

username = input('User name: ')
pin = input('PIN code: ')

if [username, pin] in database:
    print('Access granted')

Python内置的函数len、min和max很有用，len函数返回序列包含的元素个数，而min和max分别返回序列中的最小和最大的元素

>>> numbers = [100, 34, 678]
>>> len(numbers)
3
>>> max(numbers)
678
>>> min(numbers)
34
>>> max(2, 3)
3
>>> min(9, 3, 2, 5)
2

在后面的两个示例中，调用max和min时指定的实参并不是序列，而直接将数值作为实参。

列表：Python的主力

列表是不同于元组和字符串的，列表是可变的，即可以修改其内容，另外，列表也有很多特有的方法

函数list

列表是可修改的，不同于字符串不可修改，使用字符串来创建列表是很有帮助的，因此，可以使用函数list：(实际上list是一个类，而不是一个函数)

>>> list('Hello')
['H', 'e', 'l', 'l', 'o']

注意：可以将任何序列，不仅仅是字符串，作为list的参数。另外，还可以使用join来做反向操作，也就是把列表转换成一个字符串输出

>>> ''.join(['H', 'e', 'l', 'l', 'o']) # 前面的''可以是任意字符，作为分隔符使用的
'Hello'

基本的列表操作

除了可以对列表执行标准操作外，如索引、切片、拼接和相乘，还可以给元素赋值、删除元素、给切片赋值以及使用列表方法。

修改列表：给元素赋值

我们可以使用索引表示法给特定位置的元素赋值，如：x[1] = 2

>>> x = [1, 1, 1]
>>> x[1] = 2
>>> x
[1, 2, 1]

删除元素

从列表中删除元素使用del语句即可

>>> names = ['Alice', 'Beth', 'Cecil', 'Dee-Dee', 'Earl']
>>> del names[2]
>>> names
['Alice', 'Beth', 'Dee-Dee', 'Earl']

列表长度从5变成了4，del除了用于删除列表元素外，还可以用于字典，乃至变量。

给切片赋值

>>> name = list('Perl')
>>> name
['P', 'e', 'r', 'l']
>>> name[2:] = list('ar')
>>> name
['P', 'e', 'a', 'r']

通过切片赋值，还可以将切片替换为长度与其不同的序列：

>> name = list('Perl')
>>> name
['P', 'e', 'r', 'l']
>>> name[1:] = list('ython')
>>> name
['P', 'y', 't', 'h', 'o', 'n']

使用切片赋值还可以在不替换原有元素的情况下插入新元素

>>> numbers = [1, 5]
>>> numbers[1:1] = [2, 3, 4]
>>> numbers
[1, 2, 3, 4, 5]

列表方法

方法是与对象(列表、数值、字符串等)联系紧密的函数。通常我们可以像这样调用方法：

object.method(arguments)

append

方法append用于将一个对象附加到列表末尾

>>> lst = [1, 2, 3]
>>> lst.append(4)
>>> lst
[1, 2, 3, 4]

请注意：跟后面的几个方法相似，append方法就地修改列表，意思就是说它不会返回修改后的新列表，而是直接修改旧的列表

clear

方法clear就地清空列表的内容

>>> lst = [1, 2, 3]
>>> lst.clear()
>>> lst
[]

这就类似于切片语句：lst[:] = []

copy

方法copy复制列表，一般常规的赋值语句只是将另一个名称关联到当前列表

>>> a = [1, 2, 3]
>>> b = a
>>> b[1] = 4
>>> a
[1, 4, 3]

在我们将a赋值给b，修改了b，a的值也改变了，说明a和b都是指向的同一个列表，要让a和b指向不同的列表，就必须将b关联到a的副本

>>> a = [1, 2, 3]
>>> b = a.copy()
>>> b[1] = 4
>>> a
[1, 2, 3]
>>> b
[1, 4, 3]

count

方法count计算指定的元素在列表中出现了多少次

>>> ['to', 'be', 'or', 'not', 'to', 'be'].count('to')
2
>>> x = [[1, 2], 1, 1, [2, 1, [1, 2]]]
>>> x.count(1)
2
>>> x.count([1, 2])
1

extend

方法extend能够让你将多个值附加到一个列表的末尾，可以将这些值组成的序列作为参数提供给方法extend，换言之，你可以使用一个列表来扩展另一个列表

>>> a = [1, 2, 3]
>>> b = [4, 5, 6]
>>> a.extend(b)
>>> a
[1, 2, 3, 4, 5, 6]

这种情况看起来很像是两个序列的拼接，但与拼接有一定的区别，拼接是返回了一个新的列表，而原列表是不变的，但extend会修改原列表，上面的例子中是a

index

方法index在列表中查找指定值第一次出现的索引。

>>> knights = ['We', 'are', 'the', 'knights', 'who', 'say', 'ni']
>>> knights.index('who')
4
>>> knights.index('herring')
Traceback (most recent call last):
  File "<pyshell#7>", line 1, in <module>
    knights.index('herring')
ValueError: 'herring' is not in list

insert

方法insert用于将一个对象插入到列表中，其中第一个参数是要将对象插入到那个索引位置，第二个参数是即将要插入的对象。

>>> numbers = [1, 2, 3, 5, 6, 7]
>>> numbers.insert(3, 'four')
>>> numbers
[1, 2, 3, 'four', 5, 6, 7]

pop

方法pop从列表中删除一个元素(末尾为最后一个元素)，并返回这个元素，如果没有给pop提供参数，则删除最后一个。

>>> x = [1, 2, 3]
>>> x.pop()
3
>>> x
[1, 2]
>>> x.pop(0)
1
>>> x
[2]

注意：pop是唯一既修改列表又返回一个非None值的列表方法

使用pop可实现一种常见的数据结构 - 栈(stack)，栈就像一叠盘子，你可以在上面添加盘子，还可以从上面取走盘子，最后加入的盘子最后取出，这被称为后进先出(LIFO)。类似的弹夹也是这样的原理。

push和pop是实现栈操作的两个关键方法，但Python中没有push方法，不过我们可以使用append来替代。

还有一种与栈相似的数据结构 - 队列，它的规则是先进先出(FIFO)，可以使用insert(0, ...)替代append，然后使用pop(0)。但最佳的解决方案是使用模块collections中的deque

remove

remove用于删除第一个为指定值的元素.

>>> x = ['to', 'be', 'or', 'not', 'to', 'be']
>>> x.remove('be')
>>> x
['to', 'or', 'not', 'to', 'be']
>>> x.remove('bee')
Traceback (most recent call last):
  File "<pyshell#23>", line 1, in <module>
    x.remove('bee')
ValueError: list.remove(x): x not in list

remove方法就地修改且不返回值。

reverse

方法reverse按相反的顺序排列列表中的元素

>>> x = [1, 2, 3]
>>> x.reverse()
>>> x
[3, 2, 1]

注意：reverse修改列表但不返回任何值。

sort

方法sort用于对列表就地排序，就地排序意味着对原来的列表进行修改，使其元素按顺序排列，而不是返回排列后的列表副本。

>>> x = [4, 6, 2, 1, 7, 9]
>>> x.sort()
>>> x
[1, 2, 4, 6, 7, 9]

可以看出，sort方法跟上面很多方法一样，都修改了原列表，且不会返回任何值。如果我们像要对列表排序且不能修改原列表，我们就要对原列表的副本进行排序，但下面的例子是错误的：

>>> x = [4, 6, 2, 1, 7, 9]
>>> y = x.sort() # 不要这样做
>>> print(y)
None

正确的做法是：

>>> x = [4, 6, 2, 1, 7, 9]
>>> y = x.copy() # 创建x的副本，并赋值给y
>>> y.sort()
>>> x
[4, 6, 2, 1, 7, 9]
>>> y
[1, 2, 4, 6, 7, 9]

除了上面的方法外，我们还可以使用sorted方法：

[4, 6, 2, 1, 7, 9]
>>> y = sorted(x)
>>> x
[4, 6, 2, 1, 7, 9]
>>> y
[1, 2, 4, 6, 7, 9]

sorted方法可以用于任何序列，它总是返回一个列表。

>>> sorted('python')
['h', 'n', 'o', 'p', 't', 'y']

高级排序

方法sort接受两个可选参数：key和reverse。这两个参数通常是按名称指定的，称为关键字参数。我们可以将key设置为一个用于排序的函数，然后并不会直接使用这个函数来判断一个元素是否比另一个小，而是使用它来为每个元素创建一个键，再根据这些键对元素进行排序，如：把key设置为len，即根据元素长度进行排序：

>>> x = ['aardvark', 'abalone', 'acme', 'add', 'aerate']
>>> x.sort(key=len)
>>> x
['add', 'acme', 'aerate', 'abalone', 'aardvark']

对于另一个关键字参数reverse，只需为其指定一个布尔值(True或False)，以指出是否要按相反的顺序对列表进行排序

>>> x = [4, 6, 2, 1, 7, 9]
>>> x.sort(reverse=True)
>>> x
[9, 7, 6, 4, 2, 1]

元组：不可修改的序列

与列表一样，元组也是序列，它与列表唯一的差别在于元组不能被修改(字符串也不能被修改),创建元组的方法很简单，只需要用逗号将一些值隔开就能自动创建

>>> 1, 2, 3
(1, 2, 3)

但通常来讲，我们创建元素都会加上一对括号：

>>> (1, 2, 3)
(1, 2, 3)

空元组用两个不包含任何元素的圆括号表示：

>>> ()
()

如果元组里只有一个元素，请务必要给这个元素后面加上一个逗号：

>>> 42,
(42,)
>>> (42,)
(42,)

创建元组还可以使用tuple函数，它跟list和相似，将一个序列作为参数，并将其转换为一种，如果参数已经是元组，则原封不动的返回它。

>>> tuple([1, 2, 3])
(1, 2, 3)
>>> tuple('abc')
('a', 'b', 'c')
>>> tuple((1, 2, 3))
(1, 2, 3)

元组的创建及其元素的访问方式与其他序列相同。

>>> x = (1, 2, 3)
>>> x[1]
2
>>> x[0:2]
(1, 2)

元组的切片也是元组，就像列表的切片也是列表一样。

本章节完毕

本系列目录：

Mar 08 '21 03:03 kaindy7633

blog blog copied to clipboard