啊啊啊啊啊吖

2018-11-19   阅读量: 582

数据分析师 Python编程 Python数据分析

学习笔记-集合

扫码加入数据分析学习群

集合(set),它表示为一组不同的元素:

s = set()
s.add(1) # s现在是1
s.add(2) # s现在是{1,2}
s.add(2) # s还是{1,2}
x = len(s) # 等于2
y = 2 in s # 等于True
z = 3 in s # 等于False

我们使用集合的原因主要有两个。第一个是集合上有一种非常快速的操作: in。如果我们

有大量的项目,希望对它的成分进行测试,那么使用集合比使用列表要合适得多:

stopwords_list = ["a","an","at"] + hundreds_of_other_words + ["yet", "you"]
"zip" in stopwords_list # False,但需要检查每个元素
stopwords_set = set(stopwords_list)
"zip" in stopwords_set # 非常快地检查

第二个原因是便于在一个汇总中寻找其中离散的项目:

item_list = [1, 2, 3, 1, 2, 3]
num_items = len(item_list) # 6
item_set = set(item_list) # {1, 2, 3}
num_distinct_items = len(item_set) # 3
distinct_item_list = list(item_set) # [1, 2, 3]

我们使用 set 的频率要远低于 dict list

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子