数据科学专业问答社区，好文章，一字千金--CDA答疑社区

python按列删除

删除列名称的列在他的代码中，使用列名删除Passed列。axis 参数保持为1，因为1表示列。 # importing pandas module import pandas as pd # making data frame from csv file data = pd.read_csv("nba.csv", index_col ="Name" ) # dropping passed c

詹惠儿

2019-01-14

0.0000 0 2

回归分析的基本目标

回归分析的基本目标是根据自变量x的值来模拟因变量y的期望值。在简单回归中，我们使用以下等式 - y = a bx e 这里y是因变量，a是y截距，b是斜率，e是误差率。在许多情况下，这种线性模型将无法解决。例如，如果我们在这种情况下根据合成温度分析化学合成的产生，我们使用二次模型 y = a b1x b2 ^ 2 e 这里y是x的因变量，a是y截距，e是误差率。通常，我们

詹惠儿

2019-01-14

0.0000 0 0

简述多元回归分析

很多人不理解多项式回归是什么，其实多项式回归也是线性回归的一种形式，多项式回归拟合x的值与y的对应条件均值之间的非线性关系，表示为E（y | x），其中自变量x和因变量y之间的关系被建模为n次多项式。何为多项式回归：研究人员假设的一些关系是曲线的。显然，这种类型的案例将包括多项式项。检查残差。如果我们尝试将线性模型拟合到曲线数据，则预测变量（X轴）上的残差（Y轴）的散点图将在中间具有许多

詹惠儿

2019-01-14

0.0000 0 3

python如何进行主成分分析

第1步：导入库 # importing required libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd 第2步：导入数据集导入数据集并将数据集分发到X和y组件以进行数据分析。 # importing or loading the dataset dataset = pd.read

詹惠儿

2019-01-14

0.0000 0 3

如何提取特征

特征工程或特征提取是从输入数据中提取有用模式的过程，这将有助于预测模型更好地理解问题的真实性质。良好的特征学习将以一种方式呈现模式，该方式以机器学习本身不可能或太昂贵的方式显着提高所应用的机器学习算法的准确性和性能。特征学习算法找到了区分所需类并自动提取它们的常用模式。在此过程之后，它们已准备好用于分类或回归问题。让我们考虑一个流行的图像分类问题，面部图像和

詹惠儿

2019-01-14

0.0000 0 1

python的字符串操作

您可能还记得Python中的字符串和字符数据教程，您无法使用字符串执行此操作： >>> s = 'foobarbaz' >>> s[2] = 'x' Traceback (most recent call last): File "", line 1, in TypeError: 'str' object does not support item assignme

詹惠儿

2019-01-12

0.0000 0 7

列表的动态性和可变性

列表是动态的本教程首先列出了Python列表的六个定义特征。最后一个是列表是动态的。您已经在上面的部分中看到了很多这方面的例子。将项目添加到列表时，它会根据需要增长： >>> a = ['foo', 'bar', 'baz', 'qux', 'quux', 'corge'] >>> a[2:2] = [1, 2, 3] >>> a = [3.14159] >>> a ['foo', 'bar

詹惠儿

2019-01-12

0.0000 0 2

python中可用的数据结构是列表，元组和字典。集合在sets库中可用（但内置于Python 2.5及更高版本中）。列表就像一维数组（但你也可以有其他列表的列表），字典是关联数组（也就是哈希表），元组是不可变的一维数组（Python“数组”可以是任何类型，所以你可以在列表/词典/元组中混合例如整数，字符串等）。所有数组类型中第一项的索引为0. 负数从结尾到开头计数，-1是最后一项。变量可以指向函数

詹惠儿

2019-01-12

0.0000 0 2

python如何实现ANOVA？

ANOVA代表方差分析。执行以确定不同分类数据组之间的关系。在ANOVA下我们有两个测量结果： - F-testscore：显示组的变量意味着变化 p值：它显示结果的重要性这可以使用python模块scipy方法名称f_oneway（）执行语法： import scipy.stats as st st.f_oneway(sample1, sample2, ..) 这些样品是每组的样品

詹惠儿

2019-01-12

0.0000 0 3

决策树分析原理（2）

在确定哪种结果最为理想时，考虑决策者的效用偏好很重要。例如，有些人可能更喜欢低风险期权，而有些人则愿意为更大的利益承担风险。当您使用具有伴随概率模型的决策树时，您可以使用它来计算事件的条件概率，或者在发生另一事件时计算事件发生的可能性。为此，只需从初始事件开始，然后按照从该事件到目标事件的路径，将每个事件的概率相乘。通过这种方式，可以像传统的树形图一样使用决策树，其映射出某些

詹惠儿

2019-01-12

0.0000 0 1

决策树分布原理（1）

通过计算树中每个选项的预期效用或值，您可以最大限度地降低风险并最大化达到理想结果的可能性。要计算选择的预期效用，只需从预期收益中减去该决策的成本。预期收益等于该选择可能产生的所有结果的总值，每个值乘以它可能发生的可能性。以下是我们如何根据上面的示例计算这些值： a

詹惠儿

2019-01-12

0.0000 0 4

逻辑回归分类

Logistic回归不仅限于解决二元分类问题。为了解决具有多个类的问题，我们可以使用Logistic回归的扩展，其包括多项Logistic回归和Ordinal Logistic回归。让我们来看一下他们的基本想法： 1.多项Logistic回归：假设我们的目标变量有K = 4类。该技术通过拟合K-1独立二元逻辑分类器模型来处理多类问题。为此，它随机选择一个目标类作为参考类，并适合K-1回归

詹惠儿

2019-01-12

0.0000 0 1

基本概率模型

相互排斥：任何两个事件在具有非重叠结果时是互斥的，即如果A和B是两个相互排斥的事件，那么，（）P（A capB）=0。根据概率 a 的加法规则，A和B是不相交或相互排斥的事件。独立：如果一个事件对另一个事件没有影响，则任何两个事件彼此独立，即一个事件的发生不影响另一个事件的发生。如果A和B是两个独立事件，那么， a 求和规则：求和规则表明 a 这也称为边际概率，因为它通过删除表

詹惠儿

2019-01-12

0.0000 0 2

规则概率

概率提供有关事件发生可能性的信息。深入研究概率的术语：试验或实验：导致某种可能性结果的行为。样本空间：实验的所有可能结果的集合。事件：样本空间的非空子集称为事件。因此，在技术术语中，概率是衡量事件进行实验的可能性的指标。基本概率计算根据定义，如果A是实验的事件并且它包含n个结果而S是样本空间那么， a 因此，概率值介于0和1之间。由于样本空间是整个可能

詹惠儿

2019-01-12

0.0000 0 5

理解关联规则

产品规则产品规则声明， \ begin {equation} P（X \ cap Y）= P（X | Y）* P（Y）\ end {equation} 因此，X和Y都将发生的联合概率等于两个项的乘积：事件Y发生的概率。在已经发生Y的情况下发生X的概率。根据产品规则，可以推断出以下内容， a 连锁规则推广产品规则会导致链规则。设，，E1，E2，....En是

詹惠儿

2019-01-12

0.0000 0 3

简述贝叶斯定理

条件概率顾名思义的条件概率在特定事件的发生概率在满足一个或多个条件时变化时发挥作用（这些条件再次是事件）。用技术术语来说，如果X和Y是两个事件，那么X wrt Y的条件概率用 a 表示。因此，当我们以条件概率的方式进行讨论时，仅作为一个例子，我们做出一个声明，如“给定Y已经发生的事件X的概率”。如果X和Y是独立事件怎么办？根据独立事件的定义，事件X的发生不依赖于事件Y.因此， a

詹惠儿

2019-01-12

0.0000 0 3

决策树模型要注意什么

当决策树表示具有最少数量的级别或问题的大多数数据时，它被认为是最佳的。旨在创建优化决策树的算法包括CART，ASSISTANT，CLS和ID3 / 4/5。还可以通过构建关联规则来创建决策树，将目标变量放在右侧。每种方法都必须确定哪种方法是在每个级别拆分数据的最佳方法。这样做的常用方法包括测量基尼杂质，信息增益和方差减少。在机器学习中使用决策树有几个优点：使用树来预测数据的成本随着每个附

詹惠儿

2019-01-11

300.0000 1 4

简述决策树学习

决策树还可用于帮助构建自动预测模型，其在机器学习，数据挖掘和统计中具有应用。这种方法称为决策树学习，它考虑了有关项目的预测，以预测该项目的价值。在这些决策树中，节点代表数据而不是决策。这种类型的树也称为分类树。每个分支包含一组属性或分类规则，这些属性或分类规则与特定类标签相关联，该标签位于分支的末尾。这些规则也称为决策规则，可以用if-then子句表示，每个决策或数据值构成一个子句，例如

詹惠儿

2019-01-11

0.0000 0 3

简述双侧检验

双尾检验 ħ 1：参数不等于值的另一种方式来写不等于是<或> 注意不等式点两侧决策规则：如果ts cv （右），则拒绝H 0 决策规则可归纳如下：如果检验统计量落在临界区域，则拒绝H 0 （如果测试统计值比临界值更极端，则拒绝H 0）有限总体校正因子如果样本量大于种群大小的5％并且采样没有替换，则需要对平均值的标准误差进行校正。在下文中，N是种群大小，n是

詹惠儿

2019-01-11

0.0000 0 5

单侧检验有哪几种

假设检验主要分为单侧假设检验和双侧假设检验，其中单侧假设检验包括左尾和右侧假设检验检验类型由备择假设（H 1）确定 a 左尾检验 H 1：参数<值注意不等式指向左侧决策规则：如果ts 值注意不等式指向右侧决策规则：如果ts> cv，则拒绝H 0 a

詹惠儿

2019-01-11

0.0000 0 1