登录
首页精彩阅读不止高效,原来pandas表格可以更美的
不止高效,原来pandas表格可以更美的
2022-08-18
收藏

作者:派森酱

来源:Python技术

文 | ssw

来源:Python 技术「ID: pythonall」

我负责十多个地灾项目,经常需要了解设备的离线情况。公司网站按项目提供了excel表格,看起来较乱,这是下载的数据:

从原始表格里,不太容易看出这些信息:

  • 这个项目下有哪些设备类型
  • 每种类型有多少设备在线
  • 设备上线的时间顺序

这是用脚本,将数据排序分组配色后的效果(脚本和数据文件见文末)

排序

先将“最后上线时间”一列设置为行索引,使用pd.to_datetime转换为datetime类型,再排序

import pandas as pdfrom datetime import datetime,timedeltadf2 = pd.read_excel("C:/sf3/sf3/excel/1170_04-28.xlsx",sheet_name="邵阳")#将“最后上线时间”一列设置为行索引new = df2.set_index(pd.to_datetime(df2['最后上线时间']))#新列重命名new.index.name = 'last'#按时间排序new.sort_values('最后上线时间', ascending=True,inplace=True)

输出:

分组

分组可以从“设备别名”这列获取,新增一列“设备类型”

#新增一列“设备类型”new['设备类型'] = new['设备别名'].str.split('0').str[0].str.split(' ').str[0]new2 = new.groupby(['设备类型','最后上线时间','设备别名','连接状态','所属监测点'],as_index=False)new3 = new2.all()

输出:

配色

  1. 一周内离线的设备,用蓝色标注
now = datetime.now().strftime('%Y-%m-%d')sevenDaysAgo = (datetime.now() + timedelta(days=-7)).strftime('%Y-%m-%d')new3.style.highlight_between(left=sevenDaysAgo,right=now,subset=['最后上线时间'],props='font-weight:bold;color:rgb(64, 158, 255)')

输出:

  1. 给每种类型加上颜色
new3.style.highlight_between(left=sevenDaysAgo,right=now,subset=['最后上线时间'],props='font-weight:bold;color:rgb(64, 158, 255)').highlight_between(left='普适型声光报警器',right='普适型声光报警器',subset=['设备类型'],props='background:#c7f5fe').highlight_between(left='普适型声光报警器',right='声光报警器',subset=['设备类型'],props='background:#c7f5fe').highlight_between(left='普适型GNSS基准站',right='普适型GNSS基准站',subset=['设备类型'],props='background:#ffa5a5').highlight_between(left='普适型GNSS监测站',right='普适型GNSS监测站',subset=['设备类型'],props='background:#a1eafb')

输出:

  1. 在线状态的设备,用黄色标注
.highlight_between(left='在线',right='在线',subset=['连接状态'],props='background:#f9ed69')

输出:

脚本和数据文件

文件下载地址:http://ssw.fit/file/

import pandas as pdfrom datetime import datetime,timedeltadf2 = pd.read_excel("C:/sf3/sf3/excel/1170_07-28.xlsx",sheet_name="邵阳")new = df2.set_index(pd.to_datetime(df2['最后上线时间']))new.index.name = 'last'new.sort_values('最后上线时间', ascending=True,inplace=True)new['设备类型'] = new['设备别名'].str.split('0').str[0].str.split(' ').str[0]new2 = new.groupby(['设备类型','最后上线时间','设备别名','连接状态','所属监测点'],as_index=False)new3 = new2.all()now = datetime.now().strftime('%Y-%m-%d')sevenDaysAgo = (datetime.now() + timedelta(days=-7)).strftime('%Y-%m-%d')new3.style.highlight_between(left=sevenDaysAgo,right=now,subset=['最后上线时间'],props='font-weight:bold;color:rgb(64, 158, 255)').highlight_between(left='普适型声光报警器',right='普适型声光报警器',subset=['设备类型'],props='background:#c7f5fe').highlight_between(left='普适型声光报警器',right='声光报警器',subset=['设备类型'],props='background:#c7f5fe').highlight_between(left='普适型GNSS基准站',right='普适型GNSS基准站',subset=['设备类型'],props='background:#ffa5a5').highlight_between(left='普适型GNSS基站',right='普适型GNSS基站',subset=['设备类型'],props='background:#ffa5a5').highlight_between(left='普适型GNSS监测站',right='普适型GNSS监测站',subset=['设备类型'],props='background:#a1eafb').highlight_between(left='普适型裂缝计',right='普适型裂缝计',subset=['设备类型'],props='background:#a6e3e9').highlight_between(left='普适型雨量计',right='普适型雨量计',subset=['设备类型'],props='background:#71c9ce').highlight_between(left='在线',right='在线',subset=['连接状态'],props='background:#f9ed69').highlight_between(left='普适型变形桩',right='普适型变形桩',subset=['设备类型'],props='background:#cbf1f5')

总结

项目经理要我整理某个项目的离线表给他,修改下脚本里的sheet_name即可。是不是省事呢?

  • 省去登录网站下载excel
  • 省去整理表格

如果你觉得本文对你有帮助,还请点个赞支持一下~

数据分析咨询请扫描二维码

客服在线
立即咨询