京公网安备 11010802034615号
经营许可证编号:京B2-20210330
零售大数据分析应用的四个阶段
要建立数学模型要解决三个问题,首先是数据的量要达到一定的规模和质量;其实是用什么样的算法,如用时间序列还是回归或是人工智能算法;第三是“数据+算法”可以围绕什么业务场景,建立什么样的模型及参数。
中国零售业所面临的最具挑战的竞争,就是顾客和市场需求的纷繁复杂及其飘忽不定的变化。而零售企业成功乃至存活的关键,就是如何采取灵活多变且机智的应对行动,这就要求管理者要能够顺应市场的变化、快速发现并处理问题,并且及时的制定解决方案和抓住市场机会。因此,基于数据和事实,质量更高、速度更快、成本更低的决策显现了前所未有的重要性。
中国零售企业在经历的十几年的信息化高度发展的历程,也积攒了大量的宝贵数据,但面对大数据这个“金矿”,各家企业由于经营模式、管理风格、重视程度、资金投入等不同,对于这个“金矿”的挖掘程度有极大的不同,零售大数据的分析应用均处在不同的阶段,甚至出现的“两极分化”的局面。
下面就是我在日常和零售企业接触的过程所总结出来的零售大数据分析应用的四个阶段,希望能够给大家指明方向。
第一阶段丨集成展示
有句话说的好“销售额首先是追踪出来的,其次才是分析出来的”。
ERP在中国普及进程已经有了10多年历史,没有ERP的企业可谓越来越少。零售企业利用ERP可以搜集和整合整个企业的数据,形成一个完整的数据流,把企业内不同来源的数据信息集中到单一的一个仓库中来,使各个职能在自己需要的时间和地点通过图表看板、计分板的形式看到自己所需要的数据,并且展现出决策者最为关注的运营要素—关键绩效指标如销售额、坪效、利润率、客单价、进店率、转化率、目标完成率、同比增长率等等,这些都可以以“商业报告”的形式出现,该报告的主题紧紧围绕着“过去发生了什么”以及“正在发生什么”而展开,这也是大多数BI系统和数据中心平台的核心功能。
这一阶段的最大的困难为数据的集成和整合,每个零售企业都有数十个大大小小的部门系统,而这些系统都是一个独立的数据源,他们都有自己的定义、标准和侧重,而对这些来源不同数据进行合并、清理、转换和简化,最终建立一致性的数据是非常有挑战性的。
第二阶段丨分析判断
在第一阶段整合了数据来源后,零售业决策者关心的重点发生了转移,从“发生了什么”转向“为什么发生”。分析判断数据的目的是了解数据报表、商业报告的背后的含义,以及这些过往行为发生的动机和原因,这就需要对更加详细的数据进行多维度的分析。这种分析判断更多的是建立在对于零售业务逻辑的理解之上,一般会采用简单有效的分析方法和简便的分析工具对数据进行处理。
该阶段数据分析师这一角色开始真正出现,数据分析师需要非常熟悉业务,最好有实际业务操作的背景,能够用业务的语言和逻辑把运营异常解释的通顺,此阶段不要求对算法、模型和工具的应用非常高深,而对于快速将数据分析结果进行落地,赢取各个业务部门的信任的要求非常高。
例如一个服装品牌的一款裙装销售好的超出预期,那就要找从“人、货、场”三个核心来找原因分析判断火爆原因:
是否有什么买赠、打折、捆绑、支付等促销活动,店员对该商品是否有特殊的推荐等;
该商品的陈列、包装、设计、款式等是否有特色、是否是限量销售、限时特价等等;
以及顾客购买此商品的动机是什么,是否要释放压力、还是从众心理、攀比心态等;
此外,还要考虑竞争对手是否有断货问题、大型企业客户是否有团购等因素,甚至出现了在排除各种原因之后才知道,这款裙装和当时热播电视剧中某个明星穿的比较相似,因电视剧热播而带动了该款裙子的热销,虽然在该款衣服上所投入过多的市场资源其实并不多。
第三阶段丨预测未来
企业在有了前两个阶段的基础之后,关注点会进一步超越当前,开始思考更贴近经营上的问题:“将来会发生什么”。
从本质上说预测就是根据零售企业所过去发生的事件以及当前实时的影响因素,对于销售额、利润率、成本等未来的取值做出自动化和智能化的估计。简单的分析对于估算畅销概率的作用有限,在大多数复杂的应用中,需要建立数学模型来还原零售的业务规律。
例如建立销售预测模型来量化销量的影响因素及各因素之间的交互影响、建立定价优化模型来还原价格与销量之间的关系并找到最科学的价格以实现经营目标。而建立模型的目的就是将之前各个角落里的经验用数学的形式表现出来,虽然并不是十全十美,但会无限逼近真实情况。
要建立数学模型要解决三个问题,首先是数据的量要达到一定的规模和质量;其实是用什么样的算法,如用时间序列还是回归或是人工智能算法;第三是“数据+算法”可以围绕什么业务场景,建立什么样的模型及参数。
例如Google的工程师从众多关于流感的关键词组合中,挑出45个重要检索词条作为特征,训练了一个线性回归模型来预测2007年和2008年流感传播的趋势、时间和地点,该模型预测结果的准确率最后高达97%,而该模型完全可以和关于流感的商品如口罩、营养食品、非处方药品等销售建立起联系,构建“流感商品销售指数”,来指导这些商品在特定时间、地点的具体销售数量。
再例如7-Eleven零售门店通过卫星云图了解到两天后气温将上升两度,会提前订购比平常销量多30%的矿泉水。
第四阶段丨指导决策
这一阶段侧重于对业务、营运、经营、战略的决策的指导,回答的问题其实就是:“我应该做什么”才能达到最佳的状态。前三个阶段都不是终极目的,例如销售预测不是为了预测而预测,预测准确率达到100%又如何,关键是做了预测以后能给企业的决策行为带来什么样的帮助,对于零售企业而言,销售预测以后紧接着的行为就是补货,补货过程中就会涉及到多级库存管理。
而补货行为又驱动了后续的采购、生产、物流、仓储等行为,同时企业的决策层可以根据未来的预测来做出是否要开设渠道、建立工厂、购买仓库等重要战略决策,这些行为的决策都是建立在前三个阶段之上的。同时决策模拟也是这个阶段的重要应用,针对零售流程中的随机因素,引入各种约束条件,构建出若干个相互关联的场景模型来全真模拟真实情景,从而事先预知各种决策可能的结果,提高决策准确性。
大数据时代已经悄然来临,不懂大数据就做不了大生意,未来甚至做不了生意。
我所接触的不少中国零售企业对于大数据的分析应用都处在第一或者第二阶段,也有少数企业如京东、华为处在第三甚至初步进入第四阶段,虽然不少企业所处的阶段还比较低,但是至少有两点让我看到了希望:很多企业的数据基础都很不错,积攒了大量的数据,同时很多零售企业对于大数据应用的意愿和兴趣都非常强烈和热切。
这些企业对于自身的业务也非常的精通,只是受制于算法、人才、技术等对于如何把业务和数据结合在一起产生价值还不甚清楚,但是这些未来都不会成为中国零售企业对于大数据孜孜追求的障碍,因为未来一定会出现大量的第三方公司来提供专业的数据分析、建模和优化服务,帮助企业早日迈入数据驱动决策阶段。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22