|
聚类分析 |
判别分析 |
基本原理 |
将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元素的相似性更强。目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。 |
从已知的各种分类情况中总结规律(训练出判别函数),当新样品进入时,判断其与判别函数之间的相似程度(概率最大,距离最近,离差最小等判别准则) |
假设条件 |
对变量的多元正态性,方差齐性等要求较高 |
分组类型在两组以上,解释变量必须是可测的;每个解释变量不能是其它解释变量的线性组合;各解释变量之间服从多元正态分布,且各组解释变量的协方差矩阵相等 |
应用领域 |
细分市场,消费行为划分,设计抽样方案等 |
对客户进行信用预测,寻找潜在客户,临床上用于鉴别诊断 |
设有12个个体,各测了3个指标
编号 |
指标 |
||
X1 |
X2 |
X3 |
|
1 |
5 |
7 |
10 |
2 |
7 |
1 |
5 |
3 |
3 |
2 |
14 |
4 |
6 |
5 |
2 |
5 |
6 |
6 |
9 |
6 |
7 |
7 |
7 |
7 |
8 |
1 |
4 |
8 |
20 |
7 |
9 |
9 |
19 |
8 |
12 |
10 |
7 |
4 |
4 |
11 |
4 |
5 |
13 |
12 |
6 |
5 |
7 |
D1,13=min{D1,2,D1,7}=min{13,15}=13
D3,13=min{D3,2,D3,7}=min{14,16}=14
……以此类推,最终得到下表:
数据分析咨询请扫描二维码