京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据挖掘典型应用:关联分析
关联分析是一个很有用的数据挖掘模型,能够帮助企业做很多很有用的产品组合推荐、优惠促销组合,同时也能指导货架摆放是否合理,还能够找到更多的潜在客户,的确真正的把数据挖掘落到实处。
那什么是关联分析呢?
对于商家而言,有两个很重要的指标对于扩大销售规模是很重要的:
第一,提高顾客重复购买次数;
第二,提高客户订单中的Basket size(即购物篮件数)。
而第二个指标提高Basket size,就是让客户从以前只购买一件产品的转换到现在购买多件产品,从而提高整个购物篮的销售金额,最大限度地实现销售增长。但是如何挑出那些产品之间有关联销售的机会,从而形成相应的组合优惠套装呢?
在超市经常我们看到商品组合打包在一起优惠销售,例如:飘柔洗发水+玉兰油沐浴露、方便面+火腿肠,面包+牛奶,在这些产品组合的背后必然有相应的数据进行支撑,才敢推出相应的优惠组合套装,而这背后的原理就是涉及到数据挖掘中的关联分析。
关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。或者说,关联分析是发现交易数据库中不同商品(项)之间的联系。
关联分析能用来做什么呢?
可以一句话来概括:最大限度地从你口袋里面掏出更多的钱买我的产品。
1. 通过关联规则,推出相应的促销礼包或优惠组合套装,快速帮助提高销售额。如前面所说的:飘柔洗发水+玉兰油沐浴露等促销礼包;全家里面推出的牛奶+面包、豆奶+面包的早餐组合。
2. 零售超市或商场,可以通过产品关联程度大小,指导产品合理摆放,方便顾客最购买更多其所需要的产品。最常见的就是超市里面购买肉和购买蔬菜水果等货架会摆放得很近,目前就是很多人会同时购买肉与蔬菜,产品的合理摆放也是提高销售的一个关键。
3. 进行相关产品推荐或者挑选相应的关联产品进行精准营销。最常见的是你在亚马逊或京东购买产品的时候,旁边会出现购买该商品的人,有百分之多少还会购买如下的产品,快速帮助顾客找到其共同爱好的产品。物以类聚,人以群分。
4. 寻找更多潜在的目标客户。例如:100人里面,购买A的有60人,购买B的有40人,同时购买A和B的有30人,说明A里面有一半的顾客会购买B,反推而言。如果推出类似B的产品,除了向产品B的用户推荐(因为新产品与B的功能效果比较类似)之外,还可以向A的客户进行推荐,这样就能最大限度地寻找更多的目标客户。
关联分析的准备工作分析前必须进行大量的产品梳理工作,区分不同等级的层次关系,并且给相应的产品打上合适的标签。产品梳理是一项纯手工的并且需要耗费大量的人力及时间才能完成的。一般的企业,其产品不会很多,就比如P&G的产品或者其SKU数也不过是几千个,但产品梳理的标准是很重要的。产品标准过于粗放,对于后期的关联分析意义不大;产品标准过于细化,如涉及到SKU的层面的话,关联分析出的规则也不一定很理想。所以选定好一个比较合理的产品梳理规范,对于关联分析的结果精准程度很重要。因为很多SKU一般只有产品名称及价格,对数据管理比较规范的企业会打上品牌标签,其他相应的信息都是需要进行手工梳理。具体的产品梳理示例如下:
如果对于大零售超市或商场,其SKU数一般都是几十万甚至上百万,产品梳理工作是一项很痛苦的工作,但如果要从数据角度进行产品运营,建议可以开展相应的产品梳理咨询项目,通过半年多的产品梳理,形成标准化的产品梳理流程及产品目录。过去的半年里,在对某商场的产品梳理时候,发现目前的产品体系还是漏洞百出,很多还是很不规范的。做好关联分析或数据运营,请从产品梳理工作开始。
关联分析应主要事项
1. 注意购买产品赠送礼品的人为因素影响规则。有些挖掘师或分析师在做出关联分析后,看到了几条提升度及置信度都很高的规则,就兴奋不已地告诉客户:我觉得产品A和产品B有很大的关联性,从数字上看,捆绑销售肯定能够取得很好的销售效果。当拿到这样的结果的时候,客户很镇定地说:“你不知道我们在某月的时候,大量开展了购买产品A即可免费赠送产品B的活动么?”杯具,坑爹。对于这个时候的挖掘师是很悲催的。在筛选关联规则的时候,必须对该企业过去一年开展的活动有了解,还必须对不同时间段的主推产品进行提前沟通,确保关联规则不受人为因素影响。
2. 注意产品之间的位置摆放是否有很大的影响。在零售大商场中,产品摆放的位置对产品关联销售会产生很大的影响的,因为关联分析就是为了更方便地让顾客找到其需要的产品,购买更多其需要的产品。人流比较大的两个相隔货架之间的产品关联性比较大,在我们项目中会发现不少的这样规则。但其结果表明了货架关联性比较大,摆放在一起就肯定比较合理的。但在进行关联分析的时候,客户更希望能从其他不相隔的货架之间找出更好的关联销售机会,这决定了后期的关联规则挑选难题。
3. 注意关联推荐的规则合理性及流失成本的大小。后期的关联推荐应用于主要是三个方面:
重购:继续购买原来的产品;
升级:购买更高档次的产品;
交叉销售:购买相关的产品。
如果该规则的客户本来是买了50块钱的产品的,发现关联规则里面出现了推荐其购买30块的同类型产品,这等于给客户降档推荐了,会让销售额大幅减少,销售机会白白浪费并且造成了损失,所以在进行关联推荐的时候,那些涉及到了降档的规则一定要剔除。
关联分析是一个很有用的数据挖掘模型,能够帮助企业做很多很有用的产品组合推荐、优惠促销组合,同时也能指导货架摆放是否合理,还能够找到更多的潜在客户,的确真正的把数据挖掘落到实处。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05