CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

数据挖掘分类技术_数据挖掘分类

数据挖掘分类技术_数据挖掘分类
2016-12-13
数据挖掘分类技术_数据挖掘分类 1、过分拟合问题: 造成原因有:(1)噪声造成的过分拟合(因为它拟合了误标记的训练记录,导致了对检验集中记录的误分类);(2)根据少量训练记录做出分类决策的模型也容易 ...

SQL Server中存储过程比直接运行SQL语句慢的原因

SQL Server中存储过程比直接运行SQL语句慢的原因
2016-12-13
SQL Server中存储过程比直接运行SQL语句慢的原因 在很多的资料中都描述说SQLSERVER的存储过程较普通的SQL语句有以下优点: 存储过程只在创造时进行编译即可,以后每次执行存储过程都不需再重新编译,而我们 ...

在Excel中使用频率最高的函数的功能和使用方法

在Excel中使用频率最高的函数的功能和使用方法
2016-12-13
在Excel中使用频率最高的函数的功能和使用方法 在Excel中使用频率最高的函数的功能和使用方法,按字母排序: 1、ABS函数 函数名称:ABS 主要功能:求出相应数字的绝对值。 使用格式:ABS(number) ...
数据库范式1NF 2NF 3NF BCNF实例分解
2016-12-12
数据库范式1NF 2NF 3NF BCNF实例分解 设计范式(范式,数据库设计范式,数据库的设计范式)是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。在关系数据库中, 这种规则就是范式。 关系数据 ...

一个普通数据挖掘工程师的成长经历_数据挖掘工程师辛苦吗

一个普通数据挖掘工程师的成长经历_数据挖掘工程师辛苦吗
2016-12-12
一个普通数据挖掘工程师的成长经历_数据挖掘工程师辛苦吗 不知不觉毕业两年多了,有些想入门的朋友总想了解一下我是怎么学习数据挖掘、数据分析的,我就综合大家常见的问题分享一下自己的经历经验。 首先我不 ...

大数据和数据挖掘_大数据数据挖掘区别

大数据和数据挖掘_大数据数据挖掘区别
2016-12-12
大数据和数据挖掘_大数据数据挖掘区别 大数据是不是数据挖掘的延伸?两者的相似度有多少? 数据挖掘基于数据库理论,机器学习,人工智能,现代统计学的迅速发展的交叉学科,在 ...
数据挖掘技术的应用领域_数据挖掘应用前景
2016-12-12
数据挖掘技术的应用领域_数据挖掘应用前景 很多公司已成功地部署了数据挖掘应用系统。随着这一技术的早期采用者已经逐步趋于信息密集型工业时,例如财务服务和直邮市场公司,这一技术已经对任何想利用一个大的 ...

t检验中的t值和p值是什么关系_t检验和p值的关系

t检验中的t值和p值是什么关系_t检验和p值的关系
2016-12-12
t检验中的t值和p值是什么关系_t检验和p值的关系 t检验中通过样本均值 总体均值 样本标准差 样本量 可以计算出一个t值,这个t值和p值有什么关系? 根据界值表又会查出一个数,这个数和t值比较,得出大小,判断是 ...

关于模型检验的ROC值和KS值的异同_ROC曲线和KS值

关于模型检验的ROC值和KS值的异同_ROC曲线和KS值
2016-12-11
关于模型检验的ROC值和KS值的异同_ROC曲线和KS值 按我的理解,ROC曲线是累计坏占比曲线(图中蓝色曲线)下面的面积(>0.5),KS值是累计坏占比曲线-累计好占比曲线差值(图中红色曲线)的最大值。实际上他们都 ...

机器学习实战之朴素贝叶斯

机器学习实战之朴素贝叶斯
2016-12-11
机器学习实战之朴素贝叶斯 一、概述 朴素贝叶斯分类算法是基于概率论中的贝叶斯公式得到的,也是比较常用的一种算法,而朴素代表的是属性之间的独立性,这样联合概率可以转换成各概率分量的乘积。 二、算法思想 ...

用R语言求概率分布_r语言 概率分布图

用R语言求概率分布_r语言 概率分布图
2016-12-11
用R语言求概率分布_r语言 概率分布图 R语言一个很方便的用处是提供了一套完整的统计表集合。函数可以对累积分布函数P(X≤x),概率密度函数,分位函数(对给定的q,求满足P(X≤x) > q的最小x)求值,并根据分布 ...

Python的lambda匿名函数

Python的lambda匿名函数
2016-12-11
Python的lambda匿名函数 lambda函数也叫匿名函数,即,函数没有具体的名称。先来看一个最简单例子: def f(x): return x**2 print f(4) Python中使用lambda的话,写成这样 g = lambda x : x**2 print ...

二次指数平滑法摘抄_二次指数平滑法算例

二次指数平滑法摘抄_二次指数平滑法算例
2016-12-11
二次指数平滑法摘抄_二次指数平滑法算例 指数平滑法是一种特殊的加权平均法,加权的特点是对离预测值较近的历史数据给予较大的权数,对离预测期较远的历史数据给予较小的权数,权数由近到远按指数规律递减,所 ...

SPSS—非线性回归(模型表达式)案例解析

SPSS—非线性回归(模型表达式)案例解析
2016-12-11
SPSS—非线性回归(模型表达式)案例解析 由简单到复杂,人生有下坡就必有上坡,有低潮就必有高潮的迭起,随着SPSS的深入学习,已经逐渐开始走向复杂,今天跟大家交流一下,SPSS非线性回归,希望大家能够指点一二 ...

最优尺度回归分析_SPSS统计分析案例

最优尺度回归分析_SPSS统计分析案例
2016-12-10
最优尺度回归分析_SPSS统计分析案例 1、什么是最优尺度回归? 英文简称CATREG,也称分类回归。 普通线性回归对数据的要求十分严格,当遇到分类变量时,线性回归无法准确地反映分类变量不同取值的距离,比如 ...

R ceiling、round & floor_r语言

R ceiling、round & floor_r语言
2016-12-10
R ceiling、round & floor_r语言 R语言里面数字取整相关的操作有一组函数: ceiling ;floor;trunc; round; signif ceiling返回对应数字的\'天花板\'值,就是不小于该数字的最小整数 a<-(1,2.5,3.2,3 ...

用SPSS建立ARIMA预测模型实例详细教程

用SPSS建立ARIMA预测模型实例详细教程
2016-12-10
用SPSS建立ARIMA预测模型实例详细教程 ARIMA模型是随机性时间序列分析中的一大类分析方法的综合,可以进行精度较高的短期预测,这里通过实例详细介绍使用SPSS建立ARIMA模型的过程和结果解析。 SPSS任意版本 ...

R语言之主成分分析_用R语言写主成分分析的代码

R语言之主成分分析_用R语言写主成分分析的代码
2016-12-10
R语言之主成分分析_用R语言写主成分分析的代码 1、关键点 综述:主成分分析 因子分析 典型相关分析,三种方法的共同点主要是用来对数据降维处理的 从数据中提取某些公共部分,然后对这 些公共部分进行分析和 ...

T检验、F检验和统计学意义(P值或sig值)-t检验和f检验

T检验、F检验和统计学意义(P值或sig值)-t检验和f检验
2016-12-10
T检验、F检验和统计学意义(P值或sig值)-t检验和f检验 1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 ...

Excel基本操作VBA代码2-填充与边框

Excel基本操作VBA代码2-填充与边框
2016-12-09
Excel基本操作VBA代码2-填充与边框 我们来看看填充与边框相关操作的VBA代码,当然,我们只要重点的常用的操作代码,其他低概率应用操作,自己有空再去了解吧。 一、填充 首先是单元格的填充操作。 下 ...

OK