京公网安备 11010802034615号
经营许可证编号:京B2-20210330
来源:Python数据之道
作者:阳哥
大家好,我是阳哥。
字典(dict)是 python 中的基础数据类型之一,字典的设计并不复杂,我们经常会用到这种数据类型。
同时,字典也有一些比较实用的情景。
学习任何一种编程语言,基础数据类型都是必备的底层基础,今天,我们来学习下 Python 中字典的使用。
主要内容包括:
在 Python 中,字典是一种可以将相关的两个信息关联起来的操作,并且字典可存储的信息量几乎不受限制。
字典是 Python 提供的一种常用的数据结构,它用于存放具有映射关系的数据。为了保存具有映射关系的数据,Python 提供了字典,字典相当于保存了两组数据,其中一组数据是关键数据,被称为 key;另一组数据可通过 key 来访问,被称为 value。
创建字典
字典是以 key、value 的形式创建的。
字典的每个键值 key=>value 对用冒号 : 分割,每个键值对之间用逗号 , 分割,整个字典包括在花括号 {} 中 ,格式如下所示:
d = {key1 : value1, key2 : value2 }
一般情况下,字典的创建可以有以下几种方式:
# 创建一个空的字典 my_dict1 = {} # 创建 key 值为整数的字典 my_dict2 = {1: 'apple', 2: 'ball'} # 创建 key 值为 string 的字典 my_dict3 = {'name1': 'apple', 'name2': 'ball'} # 创建 key 值为 数字 和 string 混合的字典 my_dict4 = {'name': 'apple', 1: [2, 4, 3]} # 用 dict() 函数创建字典 my_dict5 = dict({1:'apple', 2:'ball'}) # 以元组的形式组成序列创建字典 my_dict6 = dict([(1,'apple'), (2,'ball')]) print('my_dict1:', my_dict1) print('my_dict2:', my_dict2) print('my_dict3:', my_dict3) print('my_dict4:', my_dict4) print('my_dict5:', my_dict5) print('my_dict6:', my_dict6)
结果如下:
my_dict1: {} my_dict2: {1: 'apple', 2: 'ball'} my_dict3: {'name1': 'apple', 'name2': 'ball'} my_dict4: {'name': 'apple', 1: [2, 4, 3]} my_dict5: {1: 'apple', 2: 'ball'} my_dict6: {1: 'apple', 2: 'ball'}
也可以通过下面的方式来创建空白字典
# 创建空白字典的另一种方式 my_dict7 = dict() # print('my_dict7:', my_dict7) my_dict7
结果如下:
{}
获取字典中的元素
通过 key 来获取 value
获取字典中的元素,可以直接通过 key 值来获取对应的 value,如下:
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3]} print(my_dict8['name']) print(my_dict8.get('name'))
结果如下:
John John
请注意,如果字典的key值中没有该元素,则不能获取相应的 value,这种情况下产生错误。
print(my_dict8['name1'])
结果如下:
--------------------------------------------------------------------------- KeyError Traceback (most recent call last)
python-input-4-eedb02e2ace8> in <module> ----> 1 print(my_dict8['name1']) KeyError: 'name1' python-
通过 value 来获取 key
通过 value 来获取 key 值,在 Python 中并没有提供直接的方法,我们可以通过自定义函数来实现,如下:
def get_keys(d, value): return [k for k,v in d.items() if v == value]
函数中,d 是字典。
在字典中修改或添加元素
在字典中,可以修改已有 key 对应的 value 值,或者添加新的 key-value 键值对数据,如下:
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3]} # 修改已有 key 对应的 value 的值 my_dict8['age'] = 98 # 添加新的 key-value 数据组 my_dict8['gender'] = 'man' my_dict8
结果如下:
{'name': 'John', 'age': 98, 1: [2, 4, 3], 'gender': 'man'}
从字典中删除元素
从字典中删除元素,或者删除整个字典,有以下一些方式。
pop() 方法
移除字典数据pop()方法的作用是:删除指定给定键所对应的值,返回这个值并从字典中把它移除。
# 使用 pop()方法来删除 my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3]} my_dict8.pop('age') my_dict8
结果如下:
{'name': 'John', 1: [2, 4, 3]}
del 方法
# 使用 del 方法来删除 my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3]} del my_dict8['name']
my_dict8
结果如下:
{'age': 25, 1: [2, 4, 3]}
popitem() 方法
# 使用 popitem()方法来删除 my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man', 'school': 'UCI', 'city': 'NewYork'}
my_dict8.popitem()
my_dict8
结果如下:
{'name': 'John', 'age': 25, 1: [2, 4, 3], 'gender': 'man', 'school': 'UCI'}
关于 popitem() 方法:
在Python 3.5版本以及之前的时候,使用 popitem() 可能是随机删除的,但我曾经用的 Python3.6版本,好像不是随机删除的,是删除的最后一项。
从 Python 3.7 版本开始,使用 popitem() 方法是删除最后一项,因为字典默认是记住了顺序的:
Ordered dictionaries are just like regular dictionaries but have some extra capabilities relating to ordering operations.
They have become less important now that the built-in dict class gained the ability to remember insertion order (this new behavior became guaranteed in Python 3.7).
另外,我查阅了一下 Python3.7 版本中的描述,如下:
popitem()
Remove and return a (key, value) pair from the dictionary. Pairs are returned in LIFO order.
popitem() is useful to destructively iterate over a dictionary, as often used in set algorithms. If the dictionary is empty, calling popitem() raises a KeyError.
Changed in version 3.7: LIFO order is now guaranteed. In prior versions, popitem() would return an arbitrary key/value pair.
https://docs.python.org/3/library/stdtypes.html#mapping-types-dict
在 Python3.7 版本中,是按照 LIFO 的原则进行删除的,是有序进行删除的。
LIFO (Last-in, first-out)即后进来的先删除(也可理解为按后面往前的排序进行删除)
clear()方法
clear()方法是用来清除字典中的所有数据,因为是原地操作,所以返回 None(也可以理解为没有返回值)
# 使用 clear()方法来清空字典中的所有数据,返回的是一个空字典 my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'} my_dict8.clear() my_dict8
结果如下:
{}
del 方法
del 方法可以删除字典中指定 key 值的内容。
另外, del 可以删除整个字典,与 clear() 方法的清空字典中所有数据是不一样的。演示如下:
使用 del方法是删除字典中指定 key 值对应的内容
# 使用 del方法是删除字典中指定 key 值对应的内容 my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'} del my_dict8['age']
my_dict8
结果如下:
{'name': 'John', 1: [2, 4, 3], 'gender': 'man'}
使用 del方法是删除整个字典,删除后,再运行程序,会报错误
# 使用 del方法是删除整个字典,删除后,再运行程序,会报错误 my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'} del my_dict8
my_dict8
结果如下:
--------------------------------------------------------------------------- NameError Traceback (most recent call last)
python-input-11-3d2a02242727> in <module> 4 del my_dict8 5 ----> 6 my_dict8 NameError: name 'my_dict8' is not definedpython-
字典内置函数&方法
Python字典包含了以下内置函数:
序号函数及描述len(dict)计算字典元素个数,即键的总数。str(dict)输出字典可打印的字符串表示。type(variable)返回输入的变量类型,如果变量是字典就返回字典类型。
len(), str(), type() 函数
my_dict6 = dict([(1,'apple'), (2,'ball')])
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'} print(len(my_dict8)) print(str(my_dict6)) print(type(my_dict8))
结果如下:
4 {1: 'apple', 2: 'ball'}
<class 'dict'>
Python字典包含以下一些方法:
函数函数描述clear()删除字典内所有元素,返回空字典copy()返回一个字典的浅复制fromkeys(seq[, val])创建一个新字典,以序列 seq 中元素做字典的键,val 为字典所有键对应的初始值get(key, default=None)返回指定键的值,如果值不在字典中返回 default 值items()以列表返回可遍历的(键, 值) 元组数组keys()以列表返回一个字典所有的键setdefault(key, default=None)和 get()类似, 但如果键不存在于字典中,将会添加键并将值设为 defaultupdate(dict2)把字典 dict2 的键/值对更新到 dict里values()以列表返回字典中的所有值pop(key[,default])删除字典给定键 key 所对应的值,返回值为被删除的值。
key 值必须给出。否则,返回 default值。popitem()随机返回并删除字典中的一对键和值。
Python 3.6及以后版本,以 LIFO 的原则进行删除的,是有序进行删除的。
clear(), get(), pop(), popitem() 等在上面已介绍的方法,这里不做重复,仅演示其他方法的使用。
copy, keys, values, items 方法
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'} print('copy:', my_dict8.copy()) print('keys:', my_dict8.keys()) print('values:', my_dict8.values()) print('items:', my_dict8.items())
结果如下:
copy: {'name': 'John', 'age': 25, 1: [2, 4, 3], 'gender': 'man'} keys: dict_keys(['name', 'age', 1, 'gender']) values: dict_values(['John', 25, [2, 4, 3], 'man']) items: dict_items([('name', 'John'), ('age', 25), (1, [2, 4, 3]), ('gender', 'man')])
update 方法
通过 update 方法,可以更新字典的数据内容:
my_dict6 = {'name': 'Lemon', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'} my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'} my_dict8.update(my_dict6) my_dict8
结果如下:
{'name': 'Lemon', 'age': 25, 1: [2, 4, 3], 'gender': 'man'}
fromkeys 方法
fromkeys()方法的演示如下:
请注意,该结果与 zip() 方法之后的结果是不一样的。
seq = ['name', 'age', 'city'] value = ['Lemon', 18, 'cs']
my_dict9 = dict.fromkeys(seq, value)
my_dict9
结果如下:
{'name': ['Lemon', 18, 'cs'], 'age': ['Lemon', 18, 'cs'], 'city': ['Lemon', 18, 'cs']}
zip()方法
seq = ['name', 'age', 'city'] value = ['Lemon', 18, 'cs']
my_dict10 = dict(zip(seq, value))
my_dict10
结果如下:
{'name': 'Lemon', 'age': 18, 'city': 'cs'}
setdefault 方法
dict.setdefault(key, default=None)
该方法接收两个参数,第一个参数是健的名称,第二个参数是默认值。
假如字典中不存在给定的键,则把默认值赋值给对应的value,并返回默认值;
反之,不修改value,只返回value。
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'} print('字典中存在的key,返回对应value:', my_dict8.setdefault('age', 0)) print('字典中不存在的key,返回默认值:', my_dict8.setdefault('age1', 0))
结果如下:
字典中存在的key,返回对应value: 25 字典中不存在的key,返回默认值: 0
此外,还可以用 setdefault() 方法统计一个列表里单词出现的次数:
# 用 setdefault() 方法统计一个列表里单词出现的次数 strings = ('Lemon', 'kitten', 'Lemon', 'Lemon', 'lemon_zs', 'Lemon', 'Lemon', 'lemon_zs')
counts = {} for kw in strings:
counts[kw] = counts.setdefault(kw, 0) + 1 counts
结果如下:
{'Lemon': 5, 'kitten': 1, 'lemon_zs': 2}
字典推导式的一般表达式如下:
{key: value for (key, value) in iterable}
有些用法与列表推导式是类似的,可以参考下面的内容:
用字典推导式的方法创建字典:
my_dict01 = {x: x*x for x in range(6)}
my_dict01
结果如下:
{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25}
通过两个list创建字典:
keys = ['name', 'age', 'city'] values = ['Lemon', 18, 'cs']
my_dict02 = {k:v for (k,v) in zip(keys,values)}
my_dict02
结果如下:
{'name': 'Lemon', 'age': 18, 'city': 'cs'}
在特定条件下,用字典推导式的方法创建字典:
my_dict03 = {x: x*x for x in range(10) if x%2==0} my_dict03
结果如下:
{0: 0, 2: 4, 4: 16, 6: 36, 8: 64}
什么是嵌套型的字典
字典是以 key、value 的形式创建的, 而嵌套型的字典有一个特征,就是 key 对应的 value 值也可以是一个字典。最简洁的嵌套型字典如下:
d = {key1 : {key3 : value3},
key2 : {key4 : value4} }
创建一个嵌套型字典
nested_dict01 = {1: {'name':'Lemon', 'age': '18', 'city':'cs'},
2: {'name':'Lemon_zs', 'age': '18', 'city':'changsha'}}
nested_dict01
结果如下:
{1: {'name': 'Lemon', 'age': '18', 'city': 'cs'}, 2: {'name': 'Lemon_zs', 'age': '18', 'city': 'changsha'}}
上述的嵌套型字典中,字典第一层的 key 分别是 1 和 2, 而他们对应的 value 值又是都是字典, 里面的字典的 key 都是 "name", "age" 和 "city", 但对应的 value 不一样。
从嵌套型字典中获取元素
从嵌套型字典中获取元素,跟从 list, 以及数组中获取元素时有些类似的。
嵌套型字典 用 [] 进行不同层级元素的获取。
nested_dict01 = {1: {'name':'Lemon', 'age': '18', 'city':'cs'}, 2: {'name':'Lemon_zs', 'age': '18', 'city':'changsha'}} print(nested_dict01[1]['name'])
print(nested_dict01[2]['city'])
结果如下:
Lemon changsha
修改嵌套型字典的元素 (更改、增加或删除元素)
针对嵌套型字典,同样是可以更新、增加或删除元素的.
增加一个空的字典
nested_dict01 = {1: {'name':'Lemon', 'age': '18', 'city':'cs'},
2: {'name':'Lemon_zs', 'age': '18', 'city':'changsha'}} # 增加一个空的字典 nested_dict01[3] = {}
nested_dict01
结果如下:
{1: {'name': 'Lemon', 'age': '18', 'city': 'cs'}, 2: {'name': 'Lemon_zs', 'age': '18', 'city': 'changsha'}, 3: {}}
修改或增加新的元素
# 修改元素内容 nested_dict01[2]['age'] = '26' # 增加新的元素 nested_dict01[3]['name'] = 'zws'
nested_dict01
结果如下:
{1: {'name': 'Lemon', 'age': '18', 'city': 'cs'}, 2: {'name': 'Lemon_zs', 'age': '26', 'city': 'changsha'}, 3: {'name': 'zws'}}
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24