傻傻分不清楚系列 | python中各种时间处理方法（下）-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读傻傻分不清楚系列 | python中各种时间处理方法（下）

傻傻分不清楚系列 | python中各种时间处理方法（下）

2020-05-25

上一篇文章中，我们理清楚了python的time库以及datetime库中各种时间对象的处理方法，以及相互之间的转化方法。

我们发现，time库以及datetime库中，确实存在名字相同，但是调用方法与所属类完全不一样的情况，这也是造成使用过程中各种混淆的原因。

今天我们把Pandas库中处理时间的各种函数与方法也加进来讨论，当然，由于Pandas中处理时间的方法和类太多太强大，我们仅仅是对其中探讨Pandas其中部分，特别是其中与time库、datetime库有关联且又容易混淆的相关知识。

(一) 此Timestamp非彼Timestamp

相信在读过前面一篇文章的同学，对time库中的unix时间戳还有印象，但是Pandas中的Timestamp对象和unix时间戳格式完全不同。

Pandas中的Timestamp对象可以说是Pandas中时间序列对象的“细胞”，如果我们有datetime64[ns]型Series对象如下：

你会发现当你提取Series第一个元素出来，返回来的就是一个Timestamp对象。当然，我们也可以自己创建一个Timestamp对象：

从上面的代码你会发现，你可以将unix时间戳、字符串型日期、datetime库中datetime.datetime通过pd.Timestamp()方法直接转化为Timestamp对象。

反过来呢？如果想将把Timestamp对象转化为unix时间戳，可以使用pd.Timestamp.timestamp()方法：

(二) 生成时间序列

Pandas作为处理多维数组的“神器”，本篇文章讲的当然是处理时间序列的方法。其中，Pandas中生成时间序列的方法不少，最常用的方法是pd.date_range()，我们看一下其使用方法：

l pd.date_range(start, end, freq) 生成一个时间段

n start:开始时间，参数可以是datetime库中的datetime对象，也可以是字符串。

n end:结束时间，参数可以是datetime库中的datetime对象，也可以是字符串。

n freq:时间频率，'Y'表示年，'M’表示月，'D’表示天，'H’表示小时，'Min’表示分钟

注意，这里开始时间和结束时间的参数指向的对象，是可以是datetime.datetime对象：

当然，这里的开始时间除了可以使用datetime.datetime实例以外（这里注意，是使用的datetime库中的类，而不是Pandas库），也可以用字符串来表示。

以start_time为2019年7月17日为例，start_time也可以是字符串'20190717'、'2019-07-17'、'2019/07/17'...

从上面可以看到，pd.date_range()方法生成的是长度为200、数据类型为datetime的DatetimeIndex对象，时间频率是天。

也就是说，2019年7月17日到2020年2月1日，算上始末的日期，一共200天。这是因为默认的频率是每天，freq='D'。也可以通过改变时间频率，详情参考上面的使用方法添加修改freq参数即可。

如果我们想要2019年7月17日为起始，按照每天的时间频率，生成长度为200的DataIndex对象，可以这样写：

相应地，如果想要以2020年2月1日为结束日，按照每天的时间频率，生成长度为200的DataIndex对象，可以这样写：

(三) .to_datetime()方法

当然，上面的方法生成的是DatetimeIindex对象，可以通过pd.Series()方法转化为Series对象：

但是对于不规范的日期字符串Series，需要使用pd.to_datetime()方法来对其进行转换，比如：

(四) DateOffset类

datetime库中有timedelta类作为日期的增减，Pandas中也有专门的DateOffset类作为时间间隔对象，可以直接作用在上面的datetime型Series对象中。

其使用方法和datetime.timedelta类相似，但是要注意的是里面的参数名最后都加了's'。

datetime型Series对象可以直接使用DataOfffset对象进行日期加减：

也可以作用在DatetimeIndex对象中：

(五) 时间序列日期格式化

要对datetime型的Series对象进行日期格式转换，可以通过Series实例的方法.dt.strftime()，其格式化字符串依然可以参照datetime库中的格式化字符串对照表：

要对datetime型的Series对象进行日期格式转换，可以通过Series实例的方法.dt.strftime()，其格式化字符串依然可以参照文章开头的datetime库中的格式化字符串对照表：

但是如果留心的话可以发现，转化之后的数据类型，已经从datetime型变成object类，也就是字符串。

如果把字符串时间date_03重新转化为datetime型Series，用上面提到的pd.to_datetime()方法即可：

(六) 结后语

time库和datetime库以及Pandas中各种对象处理时间的方法，虽然错综复杂又相互关联，但是其实在使用方面有所侧重和不同。

time库以及datetime库的对象，一般用在程序设计的中涉及到时间的问题，比如爬虫的时候在获得的不规则时间时碰到的格式转换问题，会使用很多。

Pandas中各种与时间相关的类非常多，方法非常丰富，涉及到时间处理的各个方面，主要用作序列数据的处理方面，这和time库与datetime库对单独某些日期数据处理不同。

就数据分析工作而言，对时间序列数据处理的时候Pandas用得非常多，以至于很多人几乎都忘记time库与datetime库的存在。总体而言，对于数据分析初学者而言，可以把Pandas作为重点学习方面，但是time库和datetime库作为Python标准库，其时间类的基本使用方法的学习是必不可少的。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

Series 数据分析 python

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇傻傻分不清楚系列 | python中各种时间处理方法（上）

下一篇实用宝典 | 如何用python实现人机猜拳小游戏

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

傻傻分不清楚系列 | python中各种时间处理方法（下）

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载