登录
首页精彩阅读淘宝某店铺营销分析报告
淘宝某店铺营销分析报告
2016-08-11
收藏
CDA数据科学家训练营是一个专门为数据科学家、数据工程师设置的公益培训项目,我们招募对数据科学感兴趣的在校大学生以及在职人士,重点在机器学习统计分析、软件工程和大数据等几个领域进行培养。同时,我们联合20位以上的企业数据科学家、首席数据官开展10个以上的专题应用授课。课程结束后,我们的毕业生将能够有机会加入我们合作伙伴公司的数据分析团队,或者成为我们后续的训练营合作伙伴,他们将成为企业未来不可或缺的数据科学家。 
以下是训练营第二期营销精英方向第三组营员关于淘宝某电商数据进行的业务数据分析报告,分享给大家,相互学习和指点!

分析者:韩要宾、董梦娟、宋姣、郭行桥

一 前言

在电商数据运营中,对于客户而言,有两个很重要的指标对于扩大销售规模是很重要的:第一,提高顾客重复购买次数;第二,提高客户订单中的Basket size。而第二个指标提高Basket size,就是让客户从只购买一件产品转换到现在购买多件产品,从而提高整个购物篮的销售金额,最大限度地实现销售增长。
本次报告,将对该服装店铺一年的销售数据进行关联分析,通过概念分层从不同粒度上分析商品之间的关联性,从而找到商品之间的关联规则,实现商品的推荐目的。

二 数据分析

1 数据预处理

一个购物篮中有可能多个商品且商品位于同一单元格中(如表一所示)。首先,将同一购物篮中的数据分离(如表二所示)。由于淘宝运营时,为了使得宝贝更容易被搜索到,宝贝标题一般比较多,但这对数据挖掘的影响比较大。因此,我们需要对关键词进行拆分、截取(如表四所示)。具体实现过程如下:
(1)、将"宝贝标题"列以中文逗号为分隔符进行分列
(2)、分列后的每个单元格中是一类商品的描述信息, 通过观察发现最后几位代表该类商品的代号, 利用字符串截取函数 将商品组后的代码截取出来
(3)、将截取到的商品代码去重复值,建立一张 代码-商品分类(例如:打底衫,衬衫,连衣裙,裤子)的对照表(如表三所示)
(4)、将分裂后的数据,按照建立的 代码-商品分类对照表,给出每个商品一个商品分类的结果

本次分析采用Apriori算法进行关联分析,在R语言中,必须将数据转化成两列(如表五所示)。采用VBA编程实现。代码如下所示;


表一 原始数据—宝贝标题


表二 分离购物篮商品

 
表三 商品名称截取对照表

 
表四 商品名称截取

 
表五 数据拆分

 
2 关联分析

(1)高频词分析

R语言中使用qseg类型分词,筛选100个词频最高的词,制作词云。

 
删除字符长度小于1的词,制作词云

 
代码实现如下:


(2)关联规则分析—Apriori算法

关联分析前,我们需要对置信度、支持度、提升度进行深刻的理解。如果规则的提升度很高,但其相关的置信度很小,说明其市场规模很小。市场经营必须同时考虑市场规模大小以及精准程度大小的两个维度。如果规则的精准度精准,但其受众客户就只有几百个,对于销售额而言,一点影响也没有。而如果规则的提升度不是很高,但其受众客户涉及了几万人,对该部分客户进行营销,也能够有效的扩大规模,大幅度提高销售额。

关联规则挖掘任务分解为如下两个主要的子任务:
频繁项集产生:其目标是发现满足最小支持度阀值的所有项集,这些项集称作频繁项集.
规则的产生:其目标是从上一步发现的频繁项集中提取所有高置信度的规则,这些规则必须满足最小支持度和最小置信度。这些规则称作强规则。

Minimum support: 0.01 ,Minimum metric: 0.3,结果如下:


 
 
由于置信度度量忽略了规则后件中出现的项集的支持度,高置信度的规则有时可能出现误导。
解决这个问题的一种方法是使用提升度:lift(A,B)= P(B/A)P(B)或conf(A→B)/sup(B)
  如果提升度大于1,表明A和B是正相关的。如果小于1,表明A和B是负相关的。如果等于1,说明A和B相互独立。
当提升度大于1时,那么得到的规则能更好预测结果,而不是基于数据中的频繁程度猜测结果项是否会出现。

过滤掉提升度小于等于1的规则,并且通过sort函数,根据lift对rules排序。结果如下:

 
将关联结果,根据confidence进行排序,结果如下:


 
 
从关联结果可知,买T恤\连衣裙又买裤子关联性最强,其次是T恤\衬衫和裤子。在日常生活购物中,买了T恤、衬衫后再买裤子的概率极大,关联结果比较符合事实。

代码实现如下:


3 营销策略

(1)通过词云可以清晰的观察到,这家店主要销售对象多为女性,主要营销商品品类为裤子、连衣裙、毛衣、T恤、针织、衬衣、衬衫、外套、打底、短袖(词频前10)。通过此类信息,可以确定如下营销策略安排:在淘宝店铺的主页中最热产品,店长推荐栏等显著位置,摆置以上10个品类。

(2)推荐相应的促销礼包或优惠组合套装。

 
从上述关联分析图中我们不难发现,裤子和 T恤是该店铺最畅销的产品,因此,我们采用畅销带动相关的营销策略
T恤+连衣裙、衬衫、背心、打底裤等促销。
裤子+ T恤+连衣裙、衬衫、背心、打底裤等促销。
裤子+卫衣、雪纺衫、鞋子等促销。

(3)进行相关产品推荐或者挑选相应的关联产品进行精准营销
浏览商品T恤时,在购买过此商品的用户还购买过其他商品一栏中,添加裤子、连衣裙、背心。
浏览商品裤子类目时,添加T恤、卫衣、雪纺衫、鞋子。
浏览卫衣时,推荐裤子。
浏览雪纺衫时,推荐裤子。
浏览鞋子时,推荐裤子。
浏览背心时,推荐衬衫和T恤。

4 其他
(1) 虽说我们进行的关联规则分析中,提升度以及置信度都比较高,但不意味着这样的捆绑销售就肯定可以取得很好的销售效果。因为,我们不知道该店铺在某月的时候,是否开展了类似于购买产品A即可赠送产品B的活动。

(2) 由于所给数据中我们无法获取商品的单价,如果该规则的客户本来购买了100元的商品,而关联规则中却出现了推荐其购买20元的同类型产品,这等于给客户进行了降档推荐,这样会使得销售额大幅减少,浪费销售机会。

号外:对电商数据分析感兴趣的小伙伴们,CDA也开设了电商数据分析的专题课程,导师零一,坐标上海!

详情:https://www.cda.cn/kecheng/27.html

数据分析咨询请扫描二维码

客服在线
立即咨询