先从全景网站下载数据如下:
PGC_问答站-趋势分析(2020-10-21至2020-11-19).xls


老板要求11月日均流量要达到800,所以我现在就想看下,11月份接下来的这几天我每日的uv达到多少,才能保证完成领导交给的任务。
下面是代码分分享
#导入库 import pandas import matplotlib.pyplot as plt import xlrd path="D:\\360安全浏览器下载\\PGC_问答站-趋势分析(2020-10-21至2020-11-19).xls" #导入数据 #在这里没有采用常规的导入方法,比如read_excel第一个参数直接设定为excel路径,是因为 #我们所用的这个excel文件的编码方式比较特殊,必须指定编码方式才能正确导入 #而pd.read_excel函数不支持编码参数encoding设定,所以我们用这种方式对pd.read_excel函数第一个参数io进行赋值 data=pd.read_excel(xlrd.open_workbook(path,encoding_override="GB2312"),sheet_name='趋势分析',skiprows=4,skipfooter=2)

#我们不要第0行的数据因为那是一个总计,第1行是11月19日的数据,因为这天还没有过完,所以这个数据还没有最终确定,因此这两行值没有太大意义,我们只把第2行到第19行的数据取出来。还有时段独立访客这两列取出来。

needdata=data.loc[2:19,["时段","独立访客"]]

#对数据进行重新排序和重设索引
needdata.sort_values(by="时段",inplace=True)
needdata.reset_index(inplace=True,drop=True)

#接下来计算本月剩余天数每天的平均进度,以便完成老板规定的本月目标
本月天数=30
本月目标=800*30 #24000
本月已过天数=needdata.shape[0] #18
本月剩余天数=本月天数-本月已过天数
本月已完成部分=needdata["独立访客"].sum() #14913
本月未完成部分=本月目标-本月已完成部分
本月未完成部分的任务分配到每天=本月未完成部分/本月剩余天数
print("本月未完成部分的任务分配到每天",本月未完成部分的任务分配到每天)

#不多说了,要不任务完不成了,已哭晕,求安慰。
#忘了画图了 (哭哭)
fig,ax=plt.subplots(1,1,figsize=(10,5))
ax.bar(needdata["时段"],needdata["独立访客"])
ax.set_xticklabels(needdata["时段"],rotation=80)

2.6599
5
2
关注作者
收藏
发表评论# -*- coding: utf-8 -*-
"""
Created on Mon Nov 23 11:01:18 2020
@author: Administrator
"""
#导入库
import pandas
import matplotlib.pyplot as plt
import xlrd
path="D:\\360安全浏览器下载\\PGC_问答站-趋势分析(2020-10-29至2020-11-27).xls"
#导入数据
#在这里没有采用常规的导入方法,比如read_excel第一个参数直接设定为excel路径,是因为
#我们所用的这个excel文件的编码方式比较特殊,必须指定编码方式才能正确导入
#而pd.read_excel函数不支持编码参数encoding设定,所以我们用这种方式对pd.read_excel函数第一个参数io进行赋值
data=pd.read_excel(xlrd.open_workbook(path,encoding_override="GB2312"),sheet_name='趋势分析',skiprows=4,skipfooter=2)
#把2020年11月份的数据筛出来。
needdata=data[data["时段"].str.find("2020-11")!=-1].loc[:,["时段","独立访客"]]
#把时段变量变成日期格式
needdata["时段"]=needdata["时段"].map(lambda x:pd.Timestamp(x))
#对数据进行重新排序和重设索引
needdata.sort_values(by="时段",inplace=True)
needdata.reset_index(inplace=True,drop=True)
needdata["星期几"]=needdata["时段"].map(lambda x:x.dayofweek)+1
needdata["是否为工作日"]=needdata["星期几"]<6
#接下来计算本月剩余天数每天的平均进度,以便完成老板规定的本月目标
#如果最后一天的数据还没有统计完,还需要去掉最后一天的数据
needdata=needdata.iloc[0:-1,:]
本月天数=30
本月每日目标=800
本月目标=本月每日目标*30 #24000
本月已完成部分=needdata["独立访客"].sum()
本月已过工作日天数=needdata["时段"][needdata["是否为工作日"]].count()
本月已过周末天数=needdata["时段"][needdata["是否为工作日"]==False].count()
本月已过天数=needdata.shape[0]
本月平均每日完成=本月已完成部分/本月已过天数
本月平均每个工作日完成=needdata["独立访客"][needdata["是否为工作日"]].sum()/本月已过工作日天数
本月平均每个周末日完成=needdata["独立访客"][needdata["是否为工作日"]==False].sum()/本月已过周末天数
本月剩余天数=本月天数-本月已过天数
本月未完成部分=本月目标-本月已完成部分
本月未完成部分的任务分配到每天=本月未完成部分/本月剩余天数
print("本月天数:",本月天数)
print("本月每日目标:",本月每日目标)
print("本月目标:",本月目标)
print("本月已完成部分:",本月已完成部分)
print("本月已过天数",本月已过天数)
print("本月平均每日完成",本月平均每日完成)
print("本月平均每个工作日完成:",本月平均每个工作日完成)
print("本月平均每个周末日完成:",本月平均每个周末日完成)
print("本月未完成部分:",本月未完成部分)
print("本月剩余天数:",本月剩余天数)
print("本月未完成部分的任务分配到每天",本月未完成部分的任务分配到每天)

