京公网安备 11010802034615号
经营许可证编号:京B2-20210330
作者 | CDA数据分析师
1、列表的概念
列表(list)是用来存储一组有序数据元素的数据结构,元素之间用都好分隔。列表中的数据元素应该包括在方括号中,而且列表是可变的数据类型,一旦创建了一个列表,你可以添加、删除或者搜索列表中的元素。在方括号中的数据可以是int型,也可以是str型。
2、新建一个列表
新建列表的方法比较简单,直接将数据元素用方括号括起来就行,下面是集中常见类型列表的新建实例。
■新建一个空列表,如下图:
■建立一个int类型列表
当方括号中的数据元素全部为int类型时,这个列表就是int类型的列表
■建立一个str类型列表
当方括号中的数据元素全部为str类型时,这个列表就是str类型的列表
■建立一个int+str类型列表
当方括号中的数据元素既有int类型,又有str类型时,这个列表就是int+str类型列表。
3、列表的复制
列表的复制和字符串的复制类似,也是利用*操作符。
4、列表的合并
列表的合并就是将两个现有的list合并在一起,主要有两种实现方式,一种是利用+操作符,它和字符串的连接一致;另外一种用的是extend()函数。
直接将两个列表用+操作符连接即可达到合并的目的,列表的合并是有先后顺序的。
将列表B合并到列表A中,用到的方法是A.extend(B),将列表A合并到列表B中,用到的方法是B.extend(A)。
5、向列表中插入新元素
列表是可变的,也就是当新建一个列表后你还可以对这个列表进行操作,对列表进行插入数据元素的操作主要有append()和insert()两个函数可用。这两个函数都会直接改变原列表,不会直接输出解雇哦,需要调用原列表的列表名来获取插入新元素以后的列表。
函数append()是在列表末尾插入新的数据元素,如下图:
函数insert()是在列表指定位置插入新的数据元素,如下图:
6、获取列表中值出现的次数
利用count()函数获取某个值在列表中出现的次数。
例如,全校成绩排名前五的5个学生对应的班级组成一个列表,想看一下你所在的班级(一班)有几个人在这个列表中。
7、获取列表中值出现的位置
获取值出现的位置,就是看该值位于列表中的哪里。
已知公司的所有的销售业绩是按降序排列的,想看一下杨新竹的业绩排在第几。
上边的结果是3,也就是杨新竹的业绩排第四名。
8、获取列表中指定位置的值
获取指定位置的值利用的方法和字符串索引是一致的,主要是有普通索引和切片索引两种。
(1)普通索引:普通索引是活期某一特定位置的数,如下图:
(2)切片索引:切片索引是获取某一位置区间内的数,如下图:
9、删除列表中的值
对列表中的值进行删除时,有pop()和remove()两个函数可用。
pop()函数是根据列表中的位置进行删除,也就是删除指定位置的值,如下图:
remove()函数是根据列表中的元素进行删除,也就是删除某一元素,如下图:
10、对列表中的值进行排序
对列表中的值排序利用的是sort()函数,sort()函数默认采用升序排列,如下图:
数据结构——字典
1、字典的概念
字典是一种键值对的结构,类似于通过联系人姓名查找地址和联系人详细情况的地址簿,即把键(名字)和值(详细情况)联系在一起。注意,键必须是唯一的,就像如果有两个人恰巧同名,那么你无法找到正确的信息一样。
键值对在字典中以{key1:value,key2:value}方式标记。注意,键值对内部用冒号分隔,而各个对之间用逗号分隔,所有这些都包括在花括号中。
2、新建一个字典
先创建一个空的字典,然后向该字典内输入值。下面新建一个通讯录:
将值直接以列表的形式存放在元组中,然后用dict进行转换。
将键值以列表的形式存放在元组中,然后用dict进行转换。
3、字典中的keys()、values()和items()方法
■keys()方法用来获取字典内的所有键。
■values()方法用来获取字典内的所有值。
■items()方法用来得到一组组的键值对。
数据结构——元组
1、元组的概念
元组虽然与列表类似,但是也有不同支持,元组的元素不能修改;元组适用小括号,而列表中使用中括号。
2、新建一个元组
元组的创建比较简单,直接将一组数据元素用小括号括起来即可。
3、获取元组的长度
获取元组的长度的方法与获取列表长度的方法是一样的,都使用函数len()。
4、获取元组内的元素
元组内的元素的获取方法主要分为普通索引和切片索引两种。
(1)普通索引
(2)切片索引
5、元组与列表相互转换
元组和列表是两种相似的数据结构,两者经常互相转换。
使用函数list()将元组转化为列表。
使用函数tuple()将列表转化为元组。
6、zip()函数
zip()函数用于将可迭代的对象(列表、原组)作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。zip()函数常与for循环一起搭配使用。
当迭代对象是列表时:
当迭代对象是元组时:
运算符
1、算数运算符
算数运算符就是常规的加、减、乘、除类运算。下表为基本的运算符及其示例。
2、比较运算符
比较运算符就是大于、等于、小于之类的,主要是用来做比较的,返回是True或者False的结果,常用的比较运算符如下表所示。
续集
3、逻辑运算符
逻辑运算符就是与、或、非,下表为逻辑运算符及其示例。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12