
肥皂与手纸:神奇的电商大数据分析_数据分析师
电商行业的人一定对啤酒与尿布的故事有所耳闻,20世纪90年代美国沃尔玛超市管理人员分析销售数据时候,发现了一个奇怪的现象:在一些情况下,啤酒和尿布看上去毫无关系的商品经常出现在同一购物篮中,调查发现这个现象出现在年轻的爸爸身上。这个故事讲述了零售行业的购物篮分析技术的重要性,数据技术对于零售业格外重要,今天的电商大数据技术如出一辙。
11.11这一天,京东商城卖出了80万块香皂,重量约115吨,相当于23头大象;基情无限的同时,手纸卖出900万卷,8亿多抽手纸,按一秒钟扯一抽的话,至少要扯3年,按一卷纸30米算,900万卷至少可绕地球7圈。
京东不是卖数码的么?怎么这么多人买肥皂和手纸?是啊,这就是趋势变化,一方面说明京东商城百货化成绩不俗,购物篮丰富度大大提升,另一方面也说明年轻网民们的生活必需品消费也呈现出电商化的趋势。
肥皂是用来洗手洗脸的,手纸是用来那啥那啥的,它们往往出现在人们居家的卫生间里,京东商品从过去聚焦在人们的办公工作场景,开始覆盖到人们生活的方方面面,年轻人什么都喜欢在网上买,他们是新新人类哇,属于互联网的一代人。
新新人类的崛起为京东做出了很大的贡献,主要体现在用户柔性购物需求的常态化,在京东上买数码手机或是肥皂手纸,说明京东用户已经习惯了网上购物生活,并且多样化购物,京东综合化的品牌定位已经深入人心了。
(看到此图,花粉、果粉、星粉、米粉,怪不得他们经常互喷)
2013年双十一期间,新用户主要集中在电脑办公,手机数码品类,用户数占比分别为16%、13%;2014年双十一期间,新用户主要集中在服饰内衣、鞋靴箱包等品类,用户数占比21%、12%。
在京东的这份数据里,性福指数分析占据了很大篇幅,可见京东技术部门单身男青年比例很高,他们的性福数据比其他数据要详细和精确的多,茶饮数据只有一页,而奶产品数据没有透露。
(青春是最美好的时光,人不风流枉少年,风流勿忘买套套)
让我比较伤心的一个数据是北京城区性福指数对比结果是,昌平区性福指数最高,本人居住多年的大朝阳区居然是一片灰白色,性福指数是最低的。按道理讲朝阳区北京夜生活最丰富的地区了,曾经的天上人间,灯红酒绿的三里屯都在这里,双十一朝阳区的青年们都跑哪里去了。京东的数据分析人员应该提供更长时间的数据,万一朝阳区青年时双十一前买了很多盒备用也说不准,身在朝阳区,对京东的这个数据结果表示不服!
(身为朝阳区居民,表示很不淡定)
单身贵族的性福指数高于结婚人群,这难道是因为11.11是光棍的节日的缘故吗?如果是自力更生进行磨枪,购买成人用品数量应该下降,难道是炮友密集吗?接下来的,我不敢想了,因为曾经长期单身的我没觉得比结婚人群更性福,当然……我也无法评估他们的性福指数,京东数据既然这么说,难道说明我非常纯洁吗?
虽然我已经不是19-25的性福最高年龄,也住在不幸的朝阳区,也大部分时间单身状态(但11.11我没买成人用品),但是,京东大数据报告显示年轻人在早上9-11点、晚上23-1点两个极端的时间段购物,这一点我体会不到,因为我大多数时间步行到单位,也就10分钟,这也说明11.11是真正属于年轻人的节日,我老人家熬不过他们了。
最让我感到高兴万分的一个数据是11.11这一天天蝎座的幸福指数最低,我太高兴了,这个该死的天蝎座过去长期霸占各种心灵鸡汤和段子的头牌,让我们其他星座抬不起头来,感谢京东技术们,你们让我们终于抓住天蝎座们的一个关键性弱点。
白羊座高居榜首,狮子座和巨蟹座紧随其后,我们双鱼座在中间位置,不幸的是我女朋友是射手座,射手座倒数第二,怪不得我11.11这一天没有赶上时代的步伐,原来是女朋友拖我后腿了。
性福指数让人血脉贲张,但是,生存大于享乐,从行业的角度,京东11.11大数据报告也有一些非常有价值的数据结果。比如,虽然网友在早上和深夜下单已经成为习惯,但是移动电商还是带来了不同的东西,数据显示移动端购物呈现出“随看随买”的特点,这样的消费特征让每一个时段的购物频次相当扁平化。
这告诉我们移动端碎片化时间阅读的特点,影响着移动电商的营销和顾客下单及购物篮的丰富度,移动电商借助微信、微博、QQ空间等社交平台进行相对碎片化的内容营销和口碑营销是最贴合移动电商的最佳营销场景。
文末,我十分不忍心地说一个让人难受的数据,那就是土豪性福指数高、收入很少的性福指数高、高级白领的性福指数最低。高级白领过去一直是职场精英,是人们尊敬和向往的角色,然而,京东11.11的这个数据让我们对这个看似光鲜的人群表示最真挚的同情,在这个忙碌、昂贵、拥堵、贪婪的都市里,她们美丽如虹,他们帅气如风,但是,却连做爱的时间都没有,希望高级白领们看到这篇文章转发给你的同类,应该调整自己的生活模式了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23