精彩阅读_第65页-CDA数据分析师官网

神经网络的泛化能力差吗？

泛化能力，英文全称generalization ability，指机器学习算法对新鲜样本的适应能力，一种预测新的input类别的能力。通过学习找到隐含在数据背后的规律，并对具有同一规律的学习集以外的数据，这种经过训练的网络可 ...

2020-05-21

kmeans优化算法：二分K-means聚类算法

Bi这里是的意思就是Binary，二进制的意思，所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢？就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代的过程中消失的 ...

2020-05-21

SVC是什么意思？

SVC，英文全称support vector machine，中文为支持向量机，是一种分类算法，但是也可以做回归，根据输入的数据不同可做不同的模型（若输入标签为连续值则做回归，若输入标签为分类值则用SVC()做分类） ...

2020-05-20

R语言做K-means聚类分析时确定类的个数

方法一： K平均算法（K-means聚类分析）在下面的误差平方和图中，拐点（bend or elbow）的位置对应的x轴即k-means聚类给出的合适的类的个数。 > n = 100 > g=6 > set.seed(g) > d <- data.frame(x = unlist(lap ...

2020-05-20

特异度等不可不知的11个重要机器学习模型评估指标

【磐创AI导读】：评估一个模型是建立一个有效的机器学习模型的核心部分，本文为大家介绍了一些机器学习模型评估指标，希望对大家有所帮助。评估一个模型是建立一个有效的机器学习模型的核心部分 ...

2020-05-20

最大后验估计(MAP)的简单介绍？

最大后验估计（maximum a posteriori probability estimate, 简称MAP），是贝叶斯学派的法宝之一。与统计学派不同，贝叶斯学派认为在做估计之前，人们对要估计的实物先有一个经验性的判断，然后根据数据调整对这 ...

2020-05-20

特征向量和特征值存在什么样的内在关系？

特征向量（eigenvector），矩阵理论上一个非常重要的概念，被广泛的应用于各个领域。数学上，线性变换的特征向量（本征向量）是一个非简并的向量，其方向在该变换下不变，该向量在此变换下缩放的比例称为其特征值 ...

2020-05-20

人工智能、数据挖掘、区块链、支持向量机SVM等带您读懂近30个大数据热词！

1.AI人工智能 Artificial Intelligence 人工智能（Artificial Intelligence），英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智 ...

2020-05-20

阿特曼Z-Score模型怎么做？

Z-Score，又称为再Z分数、标准分数，一个数与平均数的差再除以标准差的过程。 Z-Score能够衡量出一个分数距离平均数的相对标准距离，如果我们把每一个分数都转换成z分数，那么每一个z分数会以标准差为单位表示 ...

2020-05-20

召回率越高越好还是越低越好？

召回率（Recall），一般指查全率，指从数据库内检出的相关的信息量与总量的比率，是数据挖掘中预测、互联网中的搜索引擎等经常涉及的两个概念和指标之一。在实际应用中，多数人更喜欢称召回率为召回率，因为更能体 ...

2020-05-20

先验概率和后验概率的区别和联系？

先验概率和后验概率是与贝叶斯概率更新有关的两个概念百。假如某一不确定事件发生的主观概率因为某个新情况的出现而发生了改变，那么改变前的那个概率就被叫做先验概率，改变后的概率就叫后验概率。先验概率是指 ...

2020-05-19

模型评估：K-s曲线值变化有什么规律？

K-s是模型验证的最常用的“武器”之一，而K-s曲线指洛伦兹曲线之间的差值。 K-S曲线主要是验证模型的区分能力，通常是在模型预测全体样本的信用评分后，将全体样本按违约与非违约分为两部分，然后用K-S统计量来检验 ...

2020-05-19

有监督学习和无监督学习算法怎么理解？

在判断是有监督学习还是在无监督学习上，我们可以具体是否有监督（supervised），就看输入数据是否有标签（label）。输入数据有标签，则为有监督学习，没标签则为无监督学习。什么是学习（learning）？一个成语 ...

2020-05-19

下采样和池化的区别是什么？

有部分同学，在学习初期，会认为下采样和池化是指同样的事情，只是叫法不同而已，其实这是一种错误的认知。下采样（subsampled），或称为降采样（downsampled），指缩小图像。其主要目是使得图像符合显示区域的 ...

2020-05-19

关联分析算法：fp-growth算法的简单介绍

FP-Growth使用了一种特殊的分治策略，将提供频繁项集的数据库压缩到一棵频繁模式树（FP-tree），但仍保留项集关联信息。这种关联分析算法的概念由韩嘉炜等人在2000年提出，在FP-Growth算法中使用了一种称为频繁模 ...

2020-05-19

feature importance函数的简要介绍！

feature importance指特征重要性，在特征选择的许多方法中，我们可以使用随机森林模型中的特征重要属性来筛选特征，并得到其与分类的相关性。由于随机森林存在的固有随机性，该模型可能每次给予特征不同的重要性 ...

2020-05-19

人工智能的模式识别：特征抽取等是关键！

人工智能涉及到很多的技术，大家都知道人工智能离不开机器学习，不过比较少人知道人工智能也是离不开模式识别的。什么是模式识别呢？简单点说，模式识别就是对各种情况的识别。而在人工智能中，模式识别是一 ...

2020-05-19

机器学习中的概率估计指什么？

机器学习算法会涉及到大量的数学基础内容，数学好的童靴们，你们的优势来了。在机器学习中涉及到了三个数学工具，分别是线性代数、概率统计（概率估计）、最优化理论。今天，我们来讲概率统计，在机器学习中会涉及 ...

2020-05-19

连续型变量和离散型变量有什么区别？

在统计学中，连续型变量和离散型变量极为常见，今天我们就来看看它们的区别是什么？变量值的变动幅度不同。对离散变量，如果变量值的变动幅度小，就可以一个变量值对应一组，称单项式分组。如居民家庭按儿童数或 ...

2020-05-18

Rcall指令与call的指令区别？

一般来说，Rcall指令属于ROM空间的相对寻址范畴，call属于ROM空间的直接寻址范畴。 CALL和RCALL的区别： 1、指令长度不同； 2、指令执行所需机器周期不同； 3、寻址范围不同。 ——其他知识点普及： R ...

2020-05-18

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

从“杂乱信号”到“有序资产”：CDA数据分析师视角 ...

CDA持证人专访：周婧博谈会计行业数据分析与经营诊 ...

【CDA干货】问卷调查卡方检验：原理、前提与实战应 ...

从“整体波动”到“因子归因”：CDA数据分析师视角 ...

【CDA干货】单因素方差分析：三组及以上独立样本的 ...

【CDA干货】次日付费留存计算方法、统计口径与业务 ...

从“点状静态”到“时序动态”：CDA数据分析师视角 ...

CDA持证人专访：王晓琳谈数据分析备考与秋招实战经 ...

【CDA干货】用户决策流程全解析：核心环节、影响因 ...

从“标签”到“人”：CDA数据分析师视角下的用户画 ...

【CDA干货】透视表跨表数据应用原理与实战方法 ...

【CDA干货】正态分布异常事件识别与处理方法：数据 ...