Python pandas.DataFrame.hist函数DataFrame.hist(data, column=None, by=None, grid=True, xlabelsize=None, xrot=None, ylabelsize=None, yrot=None, ax=None, sharex=False, sharey=False, figsize=None, layout=No
隋东芝
2020-09-07
业务分析方法论一、三步法(日常取数,业务问题发现)①确认数据范围②确认分析维度③输出数据指标二、帕累托分析(二八法则)核心问题发现三、RFM模型①根据业务场景找到②设计评估模型③结合模型样式将每个指标划分不同程度④根据模型样式及程度,将数据划分至不同的类别⑤RFM模型:数据分类R最近一次消费F消费频次M消费金额(三个维度,高低两个层次)⑥RFM模型衍生--用户忠诚度消费额消费次数(两个维度,高中低
隋东芝
2020-09-04
Excel函数时间日期①year 获取指定日期的年②month 获取指定日期的月③day 获取指定日期的日④today 获取系统当前日期⑤now 获取系统当前日期和时间⑥date 返回标准日期格式的时间序列
隋东芝
2020-09-03
漏斗图又叫倒三角图,漏斗图将数据呈现为几个阶段,每个阶段的数据都是整体的一部分,从一个阶段到另一个阶段数据自上而下逐渐下降,所有阶段的占比总计100%。与饼图一样,漏斗图呈现的也不是具体的数据,而是该数据相对于总数的占比、漏斗图不需要使用任何数据轴。漏斗图适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观地发现和说明问题所在的环节,进而做出决策。漏斗图用梯
隋东芝
2020-09-02
甘特图(Gantt chart)又称为横道图、条状图(Bar chart)。其通过条状图来显示项目,进度,和其他时间相关的系统进展的内在关系随着时间进展的情况。以提出者亨利·劳伦斯·甘特(Henry Laurence Gantt)先生的名字命名。甘特图以图示通过活动列表和时间刻度表示出特定项目的顺序与持续时间。一条线条图,横轴表示时间,纵轴表示项目,线条表示期间计划和实际完成情况。直观表明计划何时
隋东芝
2020-09-01
①关键绩效指标关键绩效指标(KPI:Key Performance Indicator)是通过对组织内部流程的输入端、输出端的关键参数进行设置、取样、计算、分析,衡量流程绩效的一种目标式量化管理指标,是把企业的战略目标分解为可操作的工作目标的工具,是企业绩效管理的基础。KPI可以是部门主管明确部门的主要责任,并以此为基础,明确部门人员的业绩衡量指标。建立明确的切实可行的KPI体系,是做好绩效管理的
隋东芝
2020-08-28
一张图告诉你网站运营中的关键指标来源:https://www.runoob.com/w3cnote/website-operation.html 不少电子商务运营人员出口不离UV、PV,这两个指标固然重要,但把所有精力都耗费在此,未免有些只抓表面。 随着电子商务精细化运营的推进,越来越多深层次的运营指标显得尤为重要,回弹率、浏览用户比率、访问者参与指数等等,这些名词被你纳入日常运营参
隋东芝
2020-08-28
网站访问量的主要指标①网站的流量指标(经常用来对网站经营成效进行评价):独立访问者的数量UV;重复访问者的数量;页面浏览量PV;每个访问者的页面浏览量;一些具体页面或者文档的相关指标,例如文档下载的次数或是页面显示的次数之类。②用户行为在指标(主要反映用户是怎样进入该网站的、在网站上停留多久、访问了那些页面等):用户在网站上停留时间:用户来源网站:用户所使用的搜索引擎及关键词:用户在不同时段的访问
隋东芝
2020-08-28
电商行业常用指标①成交额度:GMV、销售额、税后销售额、退款额;GMV (Gross Merchandise Volume)一般只有平台类的电商网站才喜欢这么说法GMV = 1销售额 + 2取消订单金额 + 3拒收订单金额 + 4退货订单金额GMV是流水,只要有下了订单,生成订单号,就算GMV;而这个订单除了转化为平台的实际收入,之外还会有2、3、4这些流失量。一般GMV数据都
隋东芝
2020-08-28
Excel数据透视表中值显示方式(版本Excel2016)①行汇总的百分比:某一数值在所在行的占比②列汇总的百分比:某一数值在所在列的占比③总计的百分比:与右下角总计相比④百分比:与特定项进行相比⑤父行汇总的百分比:行维度下(多个字段)对应父级及总计的百分比⑥父列汇总的百分比:列维度下(多个字段)对应父级及总计的百分比⑦父级汇总的百分比:父级下的各项的百分比⑧差异:与某一字段的差异⑨差异百分比:与
隋东芝
2020-08-23
大数据及其特征人类历史上从未有哪个时代和今天一样产生如此海量的数据。数据的产生已经完全不受时间、地点的限制,数据的总量在不断地增加,增加的速度也在不断地加快。而要掌握大数据的概念,首要任务就是从动态上了解大数据的成因。大数据的成因,不仅是人类信息技术的进步,而且是信息技术领域不同时期多个进步交互作用的结果。从开始采用数据库作为数据管理的主要方式开始,人类社会的数据产生方式大致经历了被动、主动和自动
隋东芝
2020-08-22
AttributeError: ‘dict_items‘ object has no attribute ‘copy‘解决方法:python3.0 xgboost参数配置需要把plst = params.items()修改为plst = list(params.items())
隋东芝
2020-08-21
ModuleNotFoundError: No module named 'imblearn'解决方法①命令提示符-cmd②pip install --user imbalanced-learn
隋东芝
2020-08-21
Bagging和Boosting的概念与区别随机森林属于集成学习(ensemble learning)中的bagging算法,在集成算法中主要分为bagging算法与boosting算法,Bagging算法(套袋发)bagging的算法过程如下:从原始样本集中使用Bootstraping 方法随机抽取n个训练样本,共进行k轮抽取,得到k个训练集(k个训练集之间相互独立,元素可以有重复)。对于n个训
隋东芝
2020-08-20