关于混淆矩阵(Confusion Matrix)概念的分析和理解-CDA数据分析师官网

热线电话：13121318867

首页大数据时代关于混淆矩阵(Confusion Matrix)概念的分析和理解

关于混淆矩阵(Confusion Matrix)概念的分析和理解

2020-07-08

混淆矩阵(confusion matrix)，又被叫做错误矩阵(error matrix)。矩阵的每一列代表分类器对于样本的类别预测，矩阵的每一行代表版本所属的真实类别。

’混淆矩阵‘这个名字来源于，它能够很容易的看到机器学习是否将样本的类别给混淆了(也就是一个class被预测成另一个class)。

混淆矩阵就是为了进一步分析性能而对该算法测试结果做出的总结，现在假设有一个用来对猫(cats)、狗(dogs)、兔子(rabbits)进行分类的系统，共有 27 个动物样本：8只猫， 6条狗， 13只兔子。混淆矩阵如下图：

在预测分析中，混淆矩阵，表现为由false positives，false negatives，true positives和true negatives而组成的两行两列的表格。它允许我们做出除了正确率之外的，更多的分析。

说明一下概念：

真阳性，即 True Positive(TP): 真实为0.预测也为0

真阴性，即 False Negative(FN): 真实为0.预测为1

假阳性，即False Positive(FP): 真实为1.预测为0

假阴性，即 True Negative(TN): 真实为1.预测也为1

混淆矩阵延伸出的各个评价指标：

1.正确率(Accuracy)：被正确分类的样本比例或数量

Accuracy=(TP+TN)/Total

2.错误率(Misclassification/Error Rate)：被错误分类的样本比例或数量

Misclassification/Error Rate)=(FP+FN)/Total

3.真阳率(True Positive Rate)也叫敏感度(sensitivity)或召回率(recall)：分类器预测为正例的样本占实际正例样本数量的比例，描述了分类器对正例类别的敏感程度。

True Positive Rate=TP/ actual yes

4.假阳率(False Positive Rate)：分类器预测为正例的样本占实际负例样本数量的比例。

False Positive Rate=FP/actual no

5.特异性(Specificity)：真实为1的准确率

Specificity=TN/actual no

6. 精度(Precision)：在所有判别为正例的结果中，真正正例所占的比例，即预测为0的准确率。

Precision=TP/predicted yes

7.流行程度(Prevalence)：正例在样本中所占比例。

Prevalence=Actual Yes/Total

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

混淆矩阵召回率机器学习

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇python数据挖掘的基本任务是什么？

下一篇召回率(Recall)与精确率(precision)的区别在哪里？怎样进行衡量

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

关于混淆矩阵(Confusion Matrix)概念的分析和理解

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA 数据分析师报考条件详解与准备指南 ...

CDA数据分析师证书：AI时代的职场“黄金通行证” ...

AI时代，人人都该是CDA数据分析师

CDA 数据分析师：数据时代的价值挖掘者 ...

【CDA干货】SPSS 赋值后数据不显示？原因排查与解决 ...

【CDA干货】在 DBeaver 中利用 MySQL 实现表数据同 ...

数据分析师的技能图谱：从数据到价值的桥梁 ...

【CDA干货】Pandas 写入指定行数据：数据精细化管理 ...

解码 CDA：数据时代的通行证

CDA 精益业务数据分析：数据驱动业务增长的实战方法 ...

【CDA干货】MySQL 中 ADD KEY 与 ADD INDEX 详解： ...

解析 MySQL Update 语句中 “query end” 状态：含 ...

如何考取数据分析师证书：以 CDA 为例 ...

CDA 精益业务数据分析：驱动企业高效决策的核心引擎 ...

【CDA干货】MySQL 无外键关联表的 JOIN 实战：数据 ...

【CDA干货】Python Pandas：数据科学的瑞士军刀 ...

【CDA干货】用 SQL 生成逆向回滚 SQL：数据操作的 ...

【CDA干货】t检验与Wilcoxon检验的选择：何时用t.te ...

AI 浪潮下的生存与进阶: CDA数据分析师——开启新时 ...

【CDA干货】LSTM 模型输入长度选择技巧：提升序列建 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载