京公网安备 11010802034615号
经营许可证编号:京B2-20210330
表象层,就像汽车仪表盘,实时告诉你发生了什么,并适时做个警报提示等等,是what。分析师要做的事情就是搭建指标体系,进行各种维度的统计分析。
本质层,像诊断仪,不再停留在观察肉眼可见的表面症状,而是去检测身体内部的问题,这个层面要揭露现象背后的动因,找到规律,是why。主要做的事情就是进行个案分析获得需求动机层面的认知,然后对个体进行聚类获得全面的洞察。
抽象层,是特殊到一般的过程,对业务问题进行抽象,用模型去刻画业务问题,是how。这个层面做的事情就是把问题映射到模型,然后再用模型去做预测,减少不确定性。其产出主要是分类(标签)和排序(评分)。
现实层,是一般到特殊的过程,将抽象的模型套用到现实中来,告诉大家如何去行动,是when、where、who and whom。就像航标,要时刻为业务保驾护航,指导业务的行动。其产出主要是规则和短名单。
在明确数据分析的层次后,要想从洞察到行动,需要做到四个层次的穿透和每个层次的深入。首先,分析要能够穿透各个层次,只有上下贯通,数据分析的价值才能立竿见影。其次,在分析的每个层次上要做的深入。
一、在表象层,看数据要深入。主要体现在两个方面:
1. 从“点“到”线面体“,从看一个点的数据,到看线,看面,看体。
一般来讲,想看数据的人潜意识里是要成“体”的数据的,只是沟通过程中变成了“点”的需求,因为“点”简单容易讲明白,但是,这次给不了“体”的数据,下次还会围绕“体”的数据提各种“点”的需求,这个时候我们需要延伸一下,提前想需求方之所想,就不用来回往复了。
2. 关注数据之间的逻辑关系
这方面最值得借鉴的就是平衡计分卡了,平衡计分卡从数据指标的角度去看,就是一套带有因果关系的指标体系。
平衡计分卡通过Strategy Map把策略说清楚讲明白,通过KPI进行有效的衡量,被评价为“透视营运因果关系的绩效驱动器”(政大会计系教授 吴安妮),“将策略化为具体行动的翻译机”(台大会计系教授 杜荣瑞)。
平衡计分卡对我们的启发是,人人可以梳理出一套和自己业务相关的有逻辑关系的数据指标体系,通过它实现聚焦和协同。
二、在本质层,深入理解业务模式,并跳出既有的思维模式,建立新的心智模型。
比如我们看淘宝,淘宝业务的本质是什么呢?其中一个答案是复杂系统。
大家都知道,淘宝是一个生态系统,淘宝是一个典型的由买家、卖家、ISV、淘女郎等各种物种构成的复杂系统,阿里巴巴是一个更大的复杂系统。
复杂系统对我们的启发是,关注个体(系统内部买家卖家等参与者)的同时,注意分析个体在群体中位置和角色,分析群体的发展潜力、演化规律、竞争度、成熟度等,分析群体和群体之间关系。同时,对应的抽象层建模的方法也要与之适配。
三、在抽象层,微观上构建更加抽象的特征,宏观上构建更加抽象的模型。
1. 在既有的分析和挖掘框架下,构建更加抽象的特征(也可以理解成维度、指标)。
这个可以类比现在最火的Deep Learning技术,如果对一个图片进行识别,即使你获取的是像素信息,深度学习可以自动学习出像素背后的形状、物体的特征等中间知识,越上层的特征越接近真相。
1、对我们的启示就是,在交易笔数交易金额这种“像素级别”特征(指标)的基础上,可以考虑是否交易笔数连续上升、营销活动交易占比等带有业务含义,更加抽象同时接近业务的特征(指标)。用抽象的特征去建模可以提升模型的效果,用抽象的指标去分析可以更贴近业务需求。
2.宏观方面,可以用更加抽象的方式对业务进行建模
在前面提到淘宝是复杂系统,我们也可以对复杂系统进行建模。做些适当的简化,对淘宝做一个高度抽象,那就是一个字“网”。节点是买家、卖家等物种,边就是购买、收藏、喜欢等行为产生的关系。整个淘宝就是一张大网。
图注: 不同的颜色表示不同的细分互动市场,点代表的是店铺或者会员,连线表示会员是店铺的熟客,点的大小对店铺而言代表店铺的熟客数,对会员而言代表常购买的店铺数,越接近图的中心越表示大众化的需求,越接近图的边缘越体现需求的个性化。
建立这张大网之后,我们就可以做深入的分析,比如市场细分,个性化推荐等等。
四、在现实层,要深入到业务中去,不断提升对相关业务的认知能力。
心态上不要自我设限,分析无边界,分析师要主动参与到业务模式、产品形态的规划和设计去。要了解业务,在此基础上灵活运用模型的产出,比如:一个风险控制策 略,假如已经有一个风险事件打分模型对风险事件打分排序,分析师可以根据业务需求灵活设计模型的使用策略,例如,对于风险得分最高的时间,机器自动隔离, 风险得分偏高的,用机器+人工审核的半自动方式进行隔离。模型是死的,活用靠人。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析实战中,我们经常会遇到“多指标冗余”的问题——比如分析企业经营状况时,需同时关注营收、利润、负债率、周转率等十 ...
2026-02-04在数据分析场景中,基准比是衡量指标表现、评估业务成效、对比个体/群体差异的核心工具,广泛应用于绩效评估、业务监控、竞品对 ...
2026-02-04业务数据分析是企业日常运营的核心支撑,其核心价值在于将零散的业务数据转化为可落地的业务洞察,破解运营痛点、优化业务流程、 ...
2026-02-04在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27