秒懂！图解四个实用的pandas函数！-CDA数据分析师官网

热线电话：13121318867

首页大数据时代秒懂！图解四个实用的pandas函数！

秒懂！图解四个实用的pandas函数！

2020-10-28

作者：Baijayanta Roy

来源：towardsdatascience

编译&内容补充：早起Python

在用python进行机器学习或者日常的数据处理中，pandas是最常用的Python库之一，熟练掌握pandas是每一个数据科学家的必备技能，本文将用代码+图片详解Pandas中的四个实用函数！

shift()

假设我们有一组股票数据，需要对所有的行进行移动，或者获得前一天的股价，又或是计算最近三天的平均股价。

面对这样的需求我们可以选择自己写一个函数完成，但是使用pandas中的shift()可能是最好的选择，它可以将数据按照指定方式进行移动！

下面我们用代码进行演示，首先导入相关库并创建示例DataFrame

import pandas as pd
import numpy as np
df = pd.DataFrame({'DATE': [1, 2, 3, 4, 5],
                   'VOLUME': [100, 200, 300,400,500],
                   'PRICE': [214, 234, 253,272,291]})

现在，当我们执行df.shift(1,fill_value=0)即可将数据往下移动一行，并用0填充空值

现在，如果我们需要将前一天的股价作为新的列，则可以使用下面的代码

我们可以如下轻松地计算最近三天的平均股价，并创建一个新的列

向前移动数据也是很轻松的，使用-1即可

更多有关shift函数可以查阅官方文档，总之在涉及到数据移动时，你需要想到shift！

value_counts()

pandas中的value_counts()用于统计dataframe或series中不同数或字符串出现的次数，并可以通过降序或升序对结果对象进行排序，下图可以方便理解。

现在让我们用代码示例，首先是Index对象

下面是Series对象

同时可以对bin参数将结果划分为区间

更多的细节与参数设置，可以阅读pandas官方文档。

mask()

pandas中的mask方法比较冷门，和np.where比较类似，将对cond条件进行判断，如果cond为False，请保留原始值。如果为True，则用other中的相应值替换。

现在我们看下面的DataFrame，在这里我们要更改所有可以被二整除的元素的符号，就可以使用mask

下面是代码实现过程

nlargest()

在很多情况下，我们会遇到需要查找Series或DataFrame的前3名或后5名值的情况，例如，总得分最高的3名学生，或选举中获得的总票数的3名最低候选人

pandas中的nlargest()和nsmallest()是满足此类数据处理要求的最佳答案，下面就是从10个观测值中取最大的三个图解

下面是代码实现过程

但如果有相等的情况出现，那么可以使用first,last,all来进行保留

了解了nlargest()的使用方法后，nsmallest()就显得十分简单，本文就不再赘述，如果还有疑问可以查阅官方文档！

——热门课程推荐：

想从事业务型数据分析师，您可以点击>>>“数据分析师”了解课程详情；

想从事大数据分析师，您可以点击>>>“大数据就业”了解课程详情；

想成为人工智能工程师，您可以点击>>>“人工智能就业”了解课程详情；

想了解Python数据分析，您可以点击>>>“Python数据分析师”了解课程详情；

想咨询互联网运营，你可以点击>>>“互联网运营就业班”了解课程详情；

想了解更多优质课程，请点击>>>

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

pandas 数据分析 DataFrame 数据处理 Series 人工智能 numpy python

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇R语言绘图 | 折线图画法，如何画出你满意的图？

下一篇除了ABtest，数据分析测试方法还有这些！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

秒懂！图解四个实用的pandas函数！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载