1.首先检查一下自己的Python是否设置了环境变量,按住win R,输入cmd,点击确定,输入python,点击回车键。如果出现下面的页面,表示环境变量也配置好,不需要再配置环境变量。 2.如果出现的不是这个页面,是下面这样的,那需要配置环境变量。 3.在计算机页 面搜索栏输入anaconda3,找到anaconda3的文件夹,打开文件路径,复制文件路径。 注意:搜索栏一
liting李
2020-03-02
如图,打开Python时显示jupyter不是内部或外部命令,也不是可运行的程序或批处理文件、 如果出现了上图就表示Python没有设置环境变量,可用下面方法设置环境变量。打开anaconda3的路径,复制,点击计算机右键,管理,环境变量,点进去,找到path变量,点击,新建,江刚才复制的路径添加进去就可以了。如图:
liting李
2020-03-01
单样本t检验:检验一组数据 与某个已知的标准值之间是否存在差异 独立样本t检验:比较两组独立的样本之间是否存在差异,如一个班级的男生女生身高的差异检验 配对样本t检验:是对同一变量前后两次的数据进行检验,比如检查学生们 期中考试、期末考试成绩是否有变化,此时每个学生的期中、期末成绩是一一对应,而不是随机对应
liting李
2020-02-28
正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。
liting李
2020-02-28
两者是一个意思 数据处理之标准化/归一化,形式上是变化表达,本质上是为了比较认识。数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。由于信用指标体系的各个指标度量单位是不同的,为了能够将指标参与评价计算,需要对指标进行规范化处理,通过函数变换将其数值映射到某个数值区间。
liting李
2020-02-28
一种是把数变为(0,1)之间的小数,一种是把有量纲表达式变为无量纲表达式。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。
liting李
2020-02-28
首先,神经网络是横截面模型,时间序列是研究时间序列,行与行之间的关系。时间序列也有大数据模型,两者之间不太好做对比。
liting李
2020-02-28
客户价值区分为四类: 战略客户、利润客户、潜力客户以及普通客户。 战略客户是客户价值高,战略匹配度也高的一类客户。利润客户是客户价值高,但战略匹配度低的一类客户。潜力客户是战略匹配度高,但客户价值低的一类客户。普通客户是战略匹配度与客户价值都低的一类客户。
liting李
2020-02-28
对客户价值的研究正沿着三个不同的侧面展开:一是企业为客户提供的价值,即从客户的角度来感知企业提供产品和服务的价值;二是客户为企业提供的价值,即从企业角度出发,根据客户消费行为和消费特征等变量测度出客户能够为企业创造的价值,该客户价值衡量了客户对于企业的相对重要性,是企业进行差异化决策的重要标准;三是企业和客户互为价值感受主体和价值感受客体的客户价值研究,称为客户价值交换研究。
liting李
2020-02-28
决策数有两大优点: 1)决策树模型可以读性好,具有描述性,有助于人工分析; 2)效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。
liting李
2020-02-27
整个决策树是熵减的过程,因为熵越减越确定,如果是熵增的话,那整棵树越增长,越没有效。所以决策树长的越深越繁茂,熵就会越来越小这就是熵减的过程。
liting李
2020-02-27
这两个指标都是要看的,R方一般要配合一个指标来看的,像logistic回归要看R方和正确率,不能只看一个,要结合在一起看。
liting李
2020-02-27