
大数据之 “用户行为分析”
最典型的当属全球电子商务的创始者亚马逊(Amazon.com)了,从 1995年 首创网上售书开始,亚马逊以迅雷不及掩耳之势,彻底颠覆了从图书行业开始的很多行业的市场规则及竞争关系,10年 之内把很多像 Borders 以及 Barnes and Noble 这样的百年老店被逼到破产或濒临破产。亚马逊在利润并不丰厚的图书行业竞争中取胜的根本原因在于对数据的战略性认识和使用,在大家还都不太明白什么是电子商务时,亚马逊已经通过传统门店无法比拟的互联网手段,空前地获取了极其丰富的用户行为信息,并且进行深度分析与挖掘。
何为 “用户行为信息”(User Behavior Information)呢?简单地说,就是用户在网站上发生的所有行为,如搜索、浏览、打分、点评、加入购物筐、取出购物筐、加入期待列表(Wish List)、购买、使用减价券和退货等;甚至包括在第三方网站上的相关行为,如比价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等。
和门店通常能收集到的购买、退货、折扣、返券等和最终交易相关的信息相比,电子商务的突出特点就是可以收集到大量客户在购买前的行为信息,而不是像门店收集到的是交易信息。
在电商领域中,用户行为信息量之大令人难以想象,据专注于电商行业用户行为分析的公司的不完全统计,一个用户在选择一个产品之前,平均要浏览 5 个网站、36 个页面,在社会化媒体和搜索引擎上的交互行为也多达数十次。如果把所有可以采集的数据整合并进行衍生,一个用户的购买可能会受数千个行为维度的影响。对于一个一天 PU 近百万的中型电商上,这代表着一天近 1TB 的活跃数据。而放到整个中国电商的角度来看,更意味着每天高达数千 TB 的活跃数据。
正是这些购买前的行为信息,可以深度地反映出潜在客户的购买心理和购买意向。例如,客户 A 连续浏览了 5 款电视机,其中 4 款来自国内品牌 S,1 款来自国外品牌 T;4 款为 LED 技术,1 款为 LCD 技术;5 款的价格分别为 4599 元、5199 元、5499 元、5999 元、7999 元;这些行为某种程度上反映了客户 A 对品牌认可度及倾向性,如偏向国产品牌、中等价位的 LED 电视。而客户 B 连续浏览了 6 款电视机,其中 2 款是国外品牌 T,2 款是另一国外品牌 V,2 款是国产品牌 S;4 款为 LED 技术,2 款为 LCD 技术;6 款的价格分别为 5999 元、7999 元、8300 元、9200 元、9999 元、11050 元;类似地,这些行为某种程度上反映了客户 B 对品牌认可度及倾向性,如偏向进口品牌、高价位的 LED 电视等。
亚马逊通过对这些行为信息的分析和理解,制定对客户的贴心服务及个性化推荐。例如:当客户浏览了多款电视机而没有做购买的行为时,在一定的周期内,把适合客户的品牌、价位和类型的另一款电视机促销的信息通过电子邮件主动发送给客户;再例如,当客户再一次回到网站,对电冰箱进行浏览行为时,可以在网页上给客户 A 推荐国产中等价位的冰箱,而对客户 B 推荐进口高档价位的商品。
这样的个性化推荐服务往往会起到非常好的效果,不仅可以提高客户购买的意愿,缩短购买的路径和时间,通常还可以在比较恰当的时机捕获客户的最佳购买冲动,也降低了传统的营销方式对客户的无端骚扰,还能提高用户体验,是一个一举多得的好手段。
纵观国内外成功的电商企业,对用户行为信息的分析和使用,无不在这个兵家必争之地做大量投入。他们对数据战略性的高度认识和使用,非常值得国内的电商学习和借鉴。
团购的尴尬
相信很多人和我一样,每天电子信箱中都充满了这样的邮件,但是从来没有打开过。
很多团购公司都会虔诚地每天发给订户各种各样的促销信息,坦率地说其中很多都的确非常优惠,非常吸引人,但是这些团购公司忽略了一点——用户体验。
我们看看其中的一两个团购邮件,来分析里面的问题:
1,美食的推荐不分地域:一封邮件中,从五道口到王府井,从苏州桥到簋街,可能有人会因为一个 3 折或者更低的团购感兴趣,但是真的会从东五环开车去西四环吗?
2,娱乐的推荐也有类似的问题,丝毫没有考虑用户的地理位置,价格等因素
3,更有甚者,不分收信人的性别,有没有考虑可能带来的尴尬。
其实,所有这一切现象都表明现在的团购网站在 EDM 的思路上,基本上还是粗旷式的,把所有客户当作一人,彻底把电商的优势放弃了,回到了传统零售门店和邮寄销售模式的阶段去了。不仅如此,其实在电商的环境中这样的 EDM 有时候比没有还糟糕,因为它们恰恰带给这些可能成为他们客户的人们一个非常负面的用户体验,用长期不相关的占用大量篇幅的邮件占领用户的邮箱,长此以往,他们离 “讨人嫌” 只一步之遥了……,而对他们的惩罚可能是既简单而又残酷的,鼠标轻轻一点,他们的邮箱地址送到垃圾邮箱,从而再也无法给这个潜在的客户推送促销信息。
如果看看你的用户们的垃圾邮箱,当你看到你辛辛苦苦设计的促销直邮,规律地,全部地,在垃圾邮箱中按时报到的话,你做何感想?据专业人士分析,对一个 500 万会员的电商来说,每次 0.5%的退订或者放进垃圾邮箱,意味着近 100 万元的营销费用打了水漂。
那么,团购网站应当如何做呢?个性化是最基本也是很有效的方法:
1, 对客户进行多维度地分析:以用户的地域、性别、年龄等人文属性建立分析维度,把所有的团购信息进行筛选,这样可以简单地把 EDM 的相关性大幅提高,起码用户收到的邮件是基本在住宅、工作场所附近,和自己的普通属性相关的,可能有一些兴趣的商品。
2, 对客户过去是否有点击,是否有购买,购买的产品价值,购买的频率,最近一次什么时候购买等属性进行量化,产生客户价值的评分,把客户分出价值的高低,对推荐的接受难易程度作出评估,依据这些评分来决定多频繁对该客户进行 EDM 操作,以及推荐的商品的细类,以提高反馈率。
3, 对购买过商品客户的购买记录,以及点击过的商品记录进行分析,对团购的折扣比例,商品原价,折扣金额,团购时间长短,能否退款,是否单人使用,口味(餐饮类),风格等等分别打分、统计、归类,以对客户的可能兴趣点进行 “预测”,这是一个相对高级、相对复杂的过程,但是运用得好的话会收到非常良好的效果。
4, 考虑在所有推荐的商品旁边增加一个 “不喜欢” 的按钮,收集客户不喜欢的东西对个性化推荐来说具有几乎和喜欢的商品一样重要的价值,假设一个客户告诉你他不喜欢一款 49 元的西餐厅的双人午餐,可能比他点击甚至购买另外一个 99 元日餐双人套餐给你透露的信息还要多。
比如我观察到的一个比较成功的案例:一个旅游网站对客户之前的浏览、搜索行为进行了跟踪,并以此进行了有效的推荐,注意:该推荐中体现了客户的目的地、价位、旅游诉求等多方面的需求。按照这些方法,业界专门从事 EDM 优化的公司可以把 EDM 的点击率从传统意义上的 1%左右提高到近 10%的点击率,5000 封 EDM 产生 370 个人,510 个点击,最终共产生 800 个订单。
因此无论从什么角度来说,电子商务和团购都还有大量的优化空间,我相信以大数据为核心的个性化营销则是帮助电商在这场红海大战中赢得战役的利剑。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29