描述:第一列是销售额,第二列是销售额占比效果:方法一:使用total函数:创建一个计算字段:sum([sale])/TOTAL(sum([sale])),然后把这个字段拖过去就可以了。方法二:复制一下字段出来拖过去,然后右键-快速表计算-总额百分比方法三:分析-百分比-列有的人可能会遇到另一个问题,假如不是求某个度量占总度量的百分比,而是相对于某个度量的百分比,比如相比1月份销售增长,该怎么办呢?
liting李
2021-03-17
#按A列进行分组,得到分组后的(没有重复行)groupby对象df_group= df.groupby("A")#得到分组的总长度lenth = len(df_group.count())#得到分组后ID(行名称)对应的数量id_name = df_group.size().values#得到分组后的ID(行名称)id_num = df_group.size().index#迭代取key和valu
liting李
2021-03-17
方式一,使用 int 或者 bigint 类型。如果需要存储到分的维度,需要 *100 进行放大。方式二,使用 decimal 类型,避免精度丢失。如果使用 Java 语言时,需要使用 BigDecimal 进行对应。
liting李
2021-03-16
map函数,就是引入一个函数,然后对序列(字符串、列表、字典等)的每一个对象进行操作1.场景: 对序列的所有对象分别加1一般我们会先想到使用循环for:>>> aList=[1,2,3,4,5]>>> def add(aList): for x in range(len(aList)): aList[x]+=1 >>> add(aList)>>> aList[2, 3, 4,
liting李
2021-03-16
波士顿矩阵法是波士顿咨询公司(BCG)于1970年提出的一种规划企业产品组合的方法,因其评估的有效性,逐渐被引入情报分析领域,扩大了评估对象的范围。波士顿矩阵法的基本概念波士顿矩阵法可以用下面的模型来说明:上图中,纵坐标市场成长率表示该业务的销售量或销售额的年增长率,用数字0-20%表示,并认为市场成长率超过10%就是高速增长。横坐标相对市场份额表示该业务相对于最大竞争对手的市场份额,用于衡量企业
liting李
2021-03-16
万能公式:{=-LOOKUP(9^9,-MIDB(A2,MIN(FINDB(LEFT(ROW($1:$11)-2,1),A2&-1/19)),ROW($1:$100)))}公式详细拆解如下:①LEFT(ROW(1:11)-2,1)ROW(1:11)很好理解,返回第1行到第11行的行号,也就是11个字符组成的集合A{1,2,3…11},-2则变为字符集B{-1,0,1,2…9}。再通过LEFT提取字
liting李
2021-03-16
没啥区别用官方的可以,自己写也可以。反正都简单,如果数据量特别大涉及到并行可能官方的算的快些。
liting李
2021-03-13
标准Python的列表(list)中,元素本质是对象。如:L = [1, 2, 3],需要3个指针和三个整数对象,对于数值运算比较浪费内存和CPU。因此,Numpy提供了ndarray(N-dimensional array object)对象:存储单一数据类型的多维数组
liting李
2021-03-13
数据维度:特征数量特征选择和主成分分析使用:特征选择 特征较少时使用主成分分析 特征有上百个1、特征选择主要方法:Filter 过滤式 (方差variance)Embedded 嵌入式(正则化,决策时)Wrapper 包裹式神经网络代码示例from sklearn.feature_selection import VarianceThreshold# 特征选择-删除低方差的特征data = [
liting李
2021-03-13
朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。简单来说,朴素贝叶斯分类器假设样本每个特征与其他特征都不相关。
liting李
2021-03-13
1、打开Excel表格后,输入=LEFT(C5,3),3是要提取多少位数。2、输入公式之后,按回车键提取一串数字的前3位数。3、下拉复制公式之后,即可批量提取前面3位数了。
liting李
2021-03-13
造成产品质量的波动的原因主要有6个因素的总称a) 人(Man/Manpower):操作者对质量的认识、技术熟练程度、身体状况等;b)机器(Machine):机器设备、工夹具的精度和维护保养状况等;c)材料(Material):材料的成分、物理性能和化学性能等;d)方法(Method):这里包括加工工艺、工装选择、操作规程等;e)测量(Measurement):测量时采取的方法是否标准、正确;f)环
liting李
2021-03-13
在Excel中,每次新建的图表都会采用默认的图表格式,这种默认的图表格式可能不符合我们的要求。如果有一个已按要求设置好的图表,我们可以将该图表的格式,如绘图区、数值轴、分类轴、网格线等格式一次复制到其他图表中,十分方便。步骤如下:1.选择需要设置格式的图表,按Ctrl+C进行复制。2.在Excel 中,选择“开始”选项卡,在“剪贴板”组中单击“粘贴→选择性粘贴”。 3.选择“格式”,单击“确定”,
liting李
2021-03-13
1、相同点与不同点相同点:特征选择和特征提取二者达成的效果相似,都是试图减少数据集中属性(特征)的数量,找出最有效(同类样本的不变性、不同样本的鉴别性、对噪声的鲁棒性)的特征。不同点:特征提取(降维)主要通过属性间的关系,通过组合原有属性产生新的属性,最终会改变特征空间;特征选择是在原始数据集中提取特征的子集,是一种包含关系,不改变特征空间。
liting李
2021-03-12
数字化转型就是利用数字化技术(如大数据、云计算、人工智能等)来推动企业组织转变业务模式,组织架构,企业文化等的变革措施,如衍生出的智能制造、智慧城市等概念。数字化转型是个和大数据一样,是个有点大有点虚的概念,映射到直接落地,相对接地气的概念就是数据化管理,也是当下很多企业正在实施的措施。诸如企业的财务、销售、市场等业务自身就带有强烈的数据分析需求,领导也厌倦了查看一沓沓报表,更希望看到结论化的数据
liting李
2021-03-12
作为一种增强业务绩效的有效途经,业务优化旨在通过利用先进的技术,例如建模、数据分析等,增强业务绩效、提升运营效率,并指导特定业务流程领域的战略。 基于业务优化战略,可以识别出企业中可执行的优先目标,项目执行计划,所需的预算及其他支持等。同时,在遵循对企业影响最低原则的基础上,合理及时地与企业内的相关人员和决策者接触,将业务优化战略深入到IT及业务功能领域的各个方面。
liting李
2021-03-12
1、主成成分分析(PCA)2、线性判别分析(Linear Discriminant Analysis,LDA)映射后类内方差最小,类间方差最大3、局部线性嵌入(Locally Linear Embedding,LLE)Isomap求全局最优解,LLE算法计算量较小4、多维缩放(Multidimensional Scaling,MDS)非线性降维在降维的同时尽量保持欧式距离不变5、等度量映射(Iso
liting李
2021-03-10