京公网安备 11010802034615号
经营许可证编号:京B2-20210330
教研部出品
编辑:叶不凡
随着市场趋于成熟,要想保持企业的长期竞争力,产品和运营的改进工作需要越来越精细化。
在电商领域,客户的留存率是一个很重要的指标,为了提升留存率,需要精细化地分析客户是哪一步流失的,按照购买进程和先后顺序设置关键的节点,分析这些节点的流失情况,从而得出客户流失漏斗的模型。帮助我们通过对流失率高的环节进行精细化分析,查找原因,假设购物车在结算的时候用户的使用体验不好,在核对订单数据时常莫名出现这样或那样的技术问题,支付方式的设计不够友好等,根据这些原因就可以有的放矢的在产品和运营侧做出改进了。
在保险行业,为了提高销售效率,可以先通过模型预测出用户的销售响应率,再根据用户的响应情况将用户分别划分为几等,交由不同级别的销售人员进行跟进。我们总挂在嘴边上谈论的用户画像,增长黑客,产品画像等等,实质上都是在为实现更精细化地运营或者产品做出改进。
这其中精细化对产品的改进和运营将视企业应用数据能力的高低从而对企业提出了很高的要求,因为这些改进和决策的制定肯定不能拍脑门或者凭经验,它们需要建立在坚实、可靠的数据分析的结果之上。
企业数据能力其实就是企业应用数据的能力。这种能力总体上是由企业数据驱动业务的文化、具有特定技能的人以及具有特定功能的业务系统共同构成。
那么企业要如何建设这种数据能力来适应市场对于企业数据能力越来越高的要求呢?
从客户留存率的分析过程中发现主要有以下三方面的工作:
为了更好的支持这三方面的工作,我们可以从以下这几点入手:
1.对业务数据的维护和管理。这其中包括数据仓库/数据湖的建设,数据的标准、数据的质量、数据安全、数据模型等数据治理相关内容。不仅提高了寻找数据的效率,而且还保障了使用数据的安全。
2.基于特定主题的数据分析。包括基于各种业务指标的计算,数据建模等。
3.利用数据管理及分析的相关工具及平台对各业务数据进行管理和分析。
由于以上三个方面对应了不同的专业领域,不仅企业需要的技能很不一样,企业内部甚至常常需要分成不同的团队来支持。数据的日常维护和管理需要数据工程能力,数据分析需要的是分析和建模的能力,工具平台的开发则需要软件开发能力。
除了包含大量的规范文档定义、流程设计、沟通宣导等数据管理工作之外,还要在企业内部实现落地。通过工具平台内的内建流程帮助企业数据管理的演进上更进一步。企业内部只需少量的数据管理专家,并通过配合数据平台研发团队来实现数据的管理。比如对于数据质量的管理,数据管理专家可以针对具体的业务数据定义专用的数据质量规则,如空值规则,值域范围规则等。通过数据平台将定义的这些规则进行落地。然后数据平台定期运行脚本进行相应的数据质量检查,并生成数据质量报告以及数据质量告警,帮助团队进行数据质量改进的工作。
数据分析工作也同样需要工具平台的支持。即使能通过一个简单的sql查询语句就能实现的分析工作,也同样需要提供一个查询界面,慢慢的随着分析工作趋于复杂,直接粗放的使用数据库工具进行分析会越来越显得吃力和低效。通过将分析细分为即席查询分析,实时报表,建模分析,线上模型推理等内容。想要支持这些分析工作,没有一个高效的工具平台支撑是很难完成的。
如下图所示:
企业不仅要从需求端发展数据管理和数据分析能力,而且数据平台的建设同样不可或缺,而且数据平台的成熟程度直接关系到数据管理和数据分析的效率。
慢慢地随着企业的不断发展壮大,数据平台会越来越成为数据能力的核心内容。,随着大量的数据平台定制化需求被提出,数据平台越来越难以满足数据管理和数据分析的需求。
由于每个企业各自所处的情况不同,以上三个方面的工作量及对应的人员需求量也不尽相同。有的企业将数据相关工具和平台建设通过外部的采购来实现,功能上会相对完善,并且只需要完成工具平台的运维,管理流程落地和内部系统集成,并且工具平台的相关研发人员也可以尽量减少。如果工具和平台采用的是基于开源工具自建的,虽然会有较多的自定义功能,但这需要扩大工具平台的研发团队。当然也会有一些其他的企业,如果数据管理和数据分析人员拥有较强的软件研发能力,那么工具平台的研发可能就与数据管理和分析合并到工作中去了。
通过对数据工作的拆解和分析,也可以从以下几个维度来思考企业数据能力的建设。
一、数据人才资源的建设
从能力及其角色要求上可以大致将数据人才分为数据工程师/数据架构师,数据分析师/数据科学家。作为对这些角色的定义。企业对这些角色的工作范围和能力都有其相应的要求,这样企业就可以根据自身具体情况规划出符合自身文化的数据人才资源体系结构,从而在招聘和培养人才上面有一个整体的思路和规划。
二、人员组织和协作
企业的组织结构一般分为职能型、项目型和矩阵型。
职能型组织一般是将核心的工作划分为不同的功能部门,如产品,运营,销售,财务,审计等,这些部门按照职责范围大小组成从上到下的层级,最终形成金字塔型的结构。职能型组织结构一个典型的例子就是政府部门和一些传统的大型国企。其优势是利于各部门形成自己各自的专业优势,劣势是难以组成项目组以面向问题的方式解决企业问题。
项目型组织是以面向项目的方式组成项目组来实现人员组织和协作,其典型的例子是以外包业务为主的服务型公司。其优势是解决问题的效率高,但是不容易积累沉淀组织能力。
矩阵型组织则是希望避免职能型组织带来的部门墙问题,在职能型的基础上引入项目组织形式,在项目需要时从各职能部门抽调人员形成项目组,由项目组来统一管理。矩阵型组织常常使得某一个角色存在多位领导,从而给员工晋升及工作安排带来问题。
对于一个中大型企业而言,可以通过设立数据部并且将内部进一步细分为数据管理、数据分析、数据工具平台研发三类角色岗位,形成职能型的垂直组织结构。并且从各类细分角色抽调一部分人组成项目组以支撑业务数据分析工作。这样就形成了矩阵型的组织结构。
通过对以上组织结构的分析,企业要想做好数据工作,肯定还得涉及到很多需要更多智慧的管理工作细节。
三、数据工具平台建设
企业的工具平台往往是数据能力的依托和沉淀。数据管理中的标准和流程需要工具平台的支持否则很容易变成空中楼阁。而数据分析当中的一些工作也需要沉淀,如果不能在组织内进行交流和分享,那么企业的数据分析就变成了只是靠数据分析师自身的能力罢了。
一般我们将工具平台的建设划分为三种模式:
1.外部采购。时间成本可以节省不少,但需要注意采购的产品的功能边界,并注意该产品是否可以和内部系统有效集成,是否可以支持灵活的功能定制。
2.自建。一般考虑根据开源的项目进行改造,这样的方式的优势是可定制能力极强,其缺点就是需要大量的相关人才资源做支撑且需要一定的时间周期。
3.还有一种处于中间的模式,即:在采购产品的同时采购定制化服务,或者和第三方公司合作在基于开源产品的基础上联合开发和定制所需功能。
对于这些不同的工具平台建设模式从长远来看一个技术驱动的企业肯定对可定制能力有很高的要求,所以是否具备可定制能力将是一个必选项。而从功能上来看,采购的产品和服务往往难以完整的实现企业特定的数据管理和分析需求,因此就得需要企业通过基于这些产品提供的API进行定制开发从而将已提供的功能界面舍弃。
假设如果我们要用阿里云的数据服务,那么如何实施数据质量管理呢?这时就得需要基于阿里云的API来开发一个质量管理的工具,通过定义质量规则,配合定期的质量检测任务调度来实现。
因此,企业开发自己的数据平台界面将是企业数据工具和平台建设的关键一步。它相当于定义了企业自己的数据工作接口,而企业的特定需求服务是这一接口的具体实现而已。接口的定义往往比实现更重要,因为会有太多的企业资产依赖这样的接口去实现,比如大量的ETL脚本。接口定义好了,企业就可以按照自己的方式去设计开发上层软件,而这些上层软件则构成了企业的核心资产和竞争力,而某个接口的具体实现,则可以较为轻松的替换并且不影响企业的主要业务。
最后总结一下,综上所述从数据工作做什么出发简要分析了企业如何进行数据能力建设,且结合自己的经验从而分享一些自己的认识。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21