赵娜0418

最近邻算法有没有学习过程

最近邻算法有没有学习过程? 答:没有的。所以这个算法称为消极学习方法,而之前的那些算法称为积极学习方法。

赵娜0418

2020-02-22

0.7194 2 2
  • 关注作者
  • 收藏

在计算(1-2)时假设出现某项是零了怎么办?

在计算(1-2)时假设出现某项是零了怎么办? 答:有两种方法:(1)拉普拉斯校准或拉普拉斯估计法。假定训练数据库D很大,使得需要的每个技术加1造成的估计概率的变化可以忽略不计,但可以方便的避免概率值为零的情况。(如果对q个计数都加上1,则我们必须在用于计算概率的对应分母上加上q)。(2)条件概率的m估计。P(Xi | Yi) = (nc mp) / (n m)其中,n是类yi中的实例总数

赵娜0418

2020-02-22

0.7194 2 2
  • 关注作者
  • 收藏

决策树分类问题

预测集中的每条记录的属性取值集合是否就和训练集的某一个记录的属性取值集合相等? 答:不一定,一般来说是不可能的。但是建立的决策树一定包含该取值集合(但是可能范围会大些)。因为决策树建过程是只要当前的所有对象属于同一个标号就不再继续选择属性了,所以,实际上建立的决策树所包含的对象是比训练集中的对象要多得多的,这些多余的对象可能就包含当前的预测对象。这也是决策树能够用来进行分类的原因。

赵娜0418

2020-02-22

0.7194 2 4
  • 关注作者
  • 收藏

决策树中出现过分你和应该怎么处理?

决策树中出现过分你和应该怎么处理? 答: A):先剪枝(提前终止规则):当观察到的不纯性度量的增益(或估计的泛化误差的改进)低于某个确定的阈值时就停止扩展叶节点。B):初始决策树按照最大规模生长,然后进行剪枝的步骤,按照自底向上的方式修剪完全增长的决策树。修剪有两种方法:(1)用新的叶节点替换子树,该叶节点的类标号由子树下记录中的多数类确定;(2)用子树中常见的分支替代子树。当模型不能再改进时终止

赵娜0418

2020-02-22

0.7194 2 2
  • 关注作者
  • 收藏

泛化误差的估计有哪些?

泛化误差的估计有哪些? 答:(1)乐观估计(决策树归纳算法简单的选择产生最低训练误差的模型作为最终的模型)(2)悲观误差估计(使用训练误差与模型复杂度罚项的和计算泛化误差)(3)最小描述长度原则(模型编码的开销加上误分类记录编码的开销)(4)估计统计上界(泛化误差可以用训练误差的统计修正来估计,因为泛化误差倾向于比训练误差大,所以统计修正通常是计算训练误差的上界)(4)使用确认集(如2/3的训练集

赵娜0418

2020-02-22

0.7194 2 0
  • 关注作者
  • 收藏

造成过拟合的原因是什么?

造成过拟合的原因是什么? 答:造成原因有:(1)噪声造成的过分拟合(因为它拟合了误标记的训练记录,导致了对检验集中记录的误分类);(2)根据少量训练记录做出分类决策的模型也容易受过分拟合的影响。(由于训练数据缺乏具有代表性的样本,在没有多少训练记录的情况下,学习算法仍然继续细化模型就会产生这样的模型,当决策树的叶节点没有足够的代表性样本时,很可能做出错误的预测)(3)多重比较也可能会导致过分拟合(

赵娜0418

2020-02-22

0.8933 2 3
  • 关注作者
  • 收藏

BBN的特点问题

朴素贝叶斯没有学习的过程,那么是否可以说朴素贝叶斯是消极学习法分类? 答:(1)朴素贝叶斯只是贝叶斯分类的一种实现形式,而实现形式还有贝叶斯网络但是贝叶斯网络是有学习过程的。所以不能说贝叶斯分类时消极学习法。 (2)其实朴素贝叶斯是消极学习方法

赵娜0418

2020-02-22

0.9769 2 0
  • 关注作者
  • 收藏

置信度为95%的置信区间什么意思

置信度为95%的置信区间什么意思? 答:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。   置信区间是总体参数所在的可能范围,95%置信区间就是总体参数在这个范围的可

赵娜0418

2020-02-22

0.9516 2 2
  • 关注作者
  • 收藏

Python中的字符串该怎么截取?

Python中的字符串该怎么截取? 答: str = ‘0123456789’ print str[0:3] #截取第一位到第三位的字符 print str[:] #截取字符串的全部字符 print str[6:] #截取第七个字符到结尾 print str[:-3] #截取从头开始到倒数第三个字符之前 print str[2] #截取第三个字符 print str[-1] #截取倒数第一个字符

赵娜0418

2020-02-21

27.5426 2 1
  • 关注作者
  • 收藏

python如何一次性输入多行字符串?

python如何一次性输入多行字符串? 答:Python 2 的 raw_input()以及 Python 3 的 input()获取的是整行的字符串。 那么对于一行输入多值,例如: 输入为一行,包括用空格分隔的三个整数,分别为 a、b、c 方法一:a, b, c = map(int, raw_input('请输入3个整数, 用空格分隔:').split()) # 如果是Python 3, 自行替

赵娜0418

2020-02-21

0.2698 1 3
  • 关注作者
  • 收藏

Excel中sumproduct函数的用法

Excel中sumproduct函数的用法 答:sumproduct函数共有9中用法 1、简单数组求和 2、单一条件计数 3、比sumifs简单的多条件数据求和 4、比countifs实用的多条件记和 5、综合多参数综合权重排名 6、不同条件下跨列数求和 7、快速拆分数据 8、求排名前几的总销量 9、求总共出仓多少种产品等

赵娜0418

2020-02-21

3.1520 2 3
  • 关注作者
  • 收藏

和操作系统相关的调用有哪些?

和操作系统相关的调用有哪些? 答:和操作系统相关的调用   系统相关的信息模块 import sys sys.argv是一个list,包含所有的命令行参数. sys.stdout sys.stdin sys.stderr 分别表示标准输入输出,错误输出的文件对象. sys.stdin.readline() 从标准输入读一行 sys.stdout.write("a") 屏幕输出a sys.e

赵娜0418

2020-02-21

0.2698 1 4
  • 关注作者
  • 收藏

Python中常用的内置函数有哪些?

Python中常用的内置函数有哪些? 答:1.常用内置函数:(不用import就可以直接使用)   help(obj) 在线帮助, obj可是任何类型   callable(obj) 查看一个obj是不是可以像函数一样调用   repr(obj) 得到obj的表示字符串,可以利用这个字符串eval重建该对象的一个拷贝   eval_r(str) 表示合法的python表达式,返回这个表达式   d

赵娜0418

2020-02-21

0.2698 1 3
  • 关注作者
  • 收藏

Python中range函数的用法

Python中range函数的用法 答:Python提供的range函数可以让for循环从0到10计数,或者从10到100每次递增5。range函数的语法如下: range(start, end, step=1) range会返回一个整数序列,statr为整数序列的起始值,end为整数序列的结束值,在生成的整数序列中,不包含结束值。step为整数序列中递增的步长,默认为1。

赵娜0418

2020-02-21

0.2698 1 6
  • 关注作者
  • 收藏

Python中for循环的用法

Python中for循环的用法 答:Python的for循环语句类似于shell或是脚本语言中的foreach循环,可以迭代序列对象。使用range函数可以让Python的for循环提供类似于传统的for循环功能 1、 使用序列项迭代序列对象 通过for循环可以迭代序列对象的所有成员,并在迭代结束后,自动结束循环,其语法如下: for iter_var in list: 语句块; 其中,iter_

赵娜0418

2020-02-21

0.2698 1 0
  • 关注作者
  • 收藏

Python中merge,join,concat的区别

Python中merge,join,concat区别和用法 答:1、使用merge合并时,两个数据集的合并条件是类型须一致。默认是内连接,也可以按照需求选择outer,left,right等外连接方式 2、合并两个数据集,可在行或者列上合并(用axis调节,默认axis=0) 3、索引上的合并,是增加列而不是增加行,当合并的数据表列名字相同,通过lsuffix='', rsuffix='' 区分相

赵娜0418

2020-02-21

0.2698 1 0
  • 关注作者
  • 收藏

MySQL忘记密码

MySQL忘记密码 答:就按住window键加R,之后输入services.msc,找到Microsoft安装服务,鼠标右击选择启动

赵娜0418

2020-02-21

27.5426 2 1
  • 关注作者
  • 收藏

Python中=和==的区别

Python中=和==的区别 答:他们之间的区别就是代表的含义有所不同。 一个等号代表的含义是赋值,将某一数值赋给某个变量,比如a=3,将3这个数值赋予给a。 两个等号是判断是否相等,返回True或False,比如1==1。他们是相等的,那么就返回true。1==2,他们是不相等的,那么就返回false。

赵娜0418

2020-02-21

27.5426 2 4
  • 关注作者
  • 收藏

order()参数中"C"和"F"有什么区别?

order()参数中"C"和"F"有什么区别? 答:order参数的C和F是numpy中数组元素存储区域的两种排列格式,也就是C语言格式和Fortran语言格式

赵娜0418

2020-02-21

1.3919 2 7
  • 关注作者
  • 收藏

评分卡案例中测试集是否需要按照按训练集的分箱结果进行?

评分卡案例中测试集是否需要按照按训练集的分箱结果进行? 答:测试集不需要做分箱,直接按照训练集的分箱结果来做,因为测试集合数据集有可能分箱的结果不一样,但是模型是根据训练集的分箱结果而来的,所以说数据预处理中训练集做的数据清洗操作要在测试集做相同的操作,直接用WOE的值来进行预测即可

赵娜0418

2020-02-21

1.3919 2 2
  • 关注作者
  • 收藏
<168697071>