关联规则的评估标准和实现算法-CDA数据分析师官网

热线电话：13121318867

登录

首页大数据时代关联规则的评估标准和实现算法

关联规则的评估标准和实现算法

2020-07-01

收藏

相信做数据分析的小伙伴一定都听说过啤酒与尿布的故事，超市把有关联的东西放在一起，以方便顾客购买，这个故事体现的就是关联规则。关联规则又被称为关联分析，它的目的是在一堆事物中找出具有关联的事物。经常被应用于超市购物和电商网购的数据集中，对超市来说，运用关联规则，能够优化产品的位置摆放，方便顾客购买;对电商来说，关联规则能够帮助优化商品所在的仓库位置，从而节约成本，增加经济效益。

一、关联规则经常用支持度、置信度和提升度来进行评估。

支持度：几个关联的数据在数据集中出现的次数占总数据集的比重。

以啤酒和尿布为例，就是指客户同时购买尿布和啤酒的概率。

置信度：一个数据出现后，另一个数据出现的概率，或者说数据的条件概率。

例如：

客户购买尿布时购买啤酒的置信度，也就是购买尿布的人，同时购买啤酒的概率，( 尿布 -> 啤酒 ) 的置信度=同时购买尿布和啤酒的人数/购买尿布的人数

提升度：表示含有Y的条件下，同时含有X的概率，与X总体发生的概率之比

二、实现算法

Apriori算法是常用的用于挖掘出数据关联规则的算法

Apriori算法采用了迭代的方法

1.扫描所有数据集，先找出候选1项集及对应的支持度，筛选去掉低于支持度的1项集，产生频繁1项集。

2.在上述基础上，对剩下的频繁1项集进行连接，得到候选的频繁2项集，将低于支持度的候选频繁2项集剪枝去掉，产生真正的频繁2项集，

3.以此类推，迭代下去，直到无法找到频繁k+1项集为止也就是，当第k次循环的时候，选择频繁k项集进行并集，生成k候选集，对k候选集进行筛选剪枝，产生k频繁项集，就是算法的输出结果

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

关联规则 Apriori 数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇协同过滤：基于用户的协同过滤和基于物品的协同过滤

下一篇异常值处理常用的几种方法

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

更多

Copyright © 2015-2021, www.cda.cn All Rights Reserved. CDA数据分析师(北京国富如荷网络科技有限公司) 版权所有京ICP备11001960号-9

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

OK

客服在线

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册