京公网安备 11010802034615号
经营许可证编号:京B2-20210330
17年数据分析经验告诉你大数据行业的门道
本文根据具有十七年数据分析行业经验的嘉宾陈晨的纪实采访整理。
本期专访嘉宾:陈晨
简历:现任电通安吉斯 – 美库尔(DAN – Merkle) 中国(上海/南京) 数据与分析部高级总监,兼任Merkle南京公司总负责人。十七年以上美国、加拿大及中国咨询业及行业领先公司数据营销、风险分析、定量模型,客户关系管理策略的经验,拥有市场营销、定量方法 、经济计量和统计学方面坚实基础,和建立银行/金融/零售业营销模型和信用评分模型的丰富项目背景。
Q:如果企业想要挖掘数据价值,但由于种种原因,导致数据本身维度不完备,或缺失较多等情况。您能利用多年项目经验,跟我们分享一下这类企业应该怎样有效利用数据吗?
陈晨:对于广告营销而言,有用的数据维度是越多越好。即使企业自身CRM做得非常完备,有了其他数据源的补充,对于理解现有客户群体,如何进行下一步营销活动的准备都是非常有好处的。
事实上,没有任何一家数据提供商能够满足品牌所有的营销信息需求,品牌需要的是因地制宜地购买、结合与其最相关的高质量数据内容。Merkle可以利用其购买力和强大的合作伙伴网络,帮助品牌在全球范围内找到需要的数据,再结合数据整合和落地效果分析,为客户创造了战略优势。
按照Merkle常用的用户生命周期来说,我们把用户的生命周期分成接触潜在用户(获客阶段)、老客维护(互动阶段)及留存分析(促使回购阶段)。在获客阶段,Merkle可以结合其他数据来源,丰富数据维度。比如我们在为某知名在线英语教育品牌服务中,由于客户本身数据不足以支撑建模,我们就利用运营商数据和某知名科技公司数据为客户做了数据增强,用户画像及建模准确度都提高了不少。
而且和运营商数据做对接有个好处,运营商天然有接触消费者的渠道,所以这个项目的第二阶段,我们会应用模型挑选最有可能转化的消费者,通过发短信、弹窗的形式,在合适的触点做营销活动。
如果是在互动阶段,数据维度越多,我们越能基于用户行为/状态对用户分群,实现个性化交互。举例来说,我们曾为NBA提供了Loyalty Plus平台解决方案,帮助客户打造出“NBA球迷圈“。”球迷圈”是Merkle通过收集、清洗和整合多个数据源的顾客数据,确立会员策略,为NBA中国建立的客户忠诚度系统,从而可以基于球迷的行为和状态建立球迷分群,个性化地实施与球迷的有效交互。
目前该忠诚度系统已有超过60万球迷注册,活跃用户达到64%,收集到的会员交互数据将用于客户分群和定制化的服务,实现营销上升闭环的效果。对于留存分析而言,更多的做竞品分析,了解用户为何流失。
在用户生命周期的不同时段,不同对应策略
Q:什么情况下公司会考虑利用数据分析/模型来做优化,具体怎么操作,落地效果又是如何评估的呢?
陈晨:从根本来说,数据分析/建模/统计等都是用来更科学的衡量数据资产的一些方法。就我的角度来讲,只要有数据,有余力,都可以尝试从数据中感知用户,提升营销效果。
我们姑且把公司分为两类,一类是注重用户增长型的企业,一类是注重客户维系的企业,当然这个划分不是很严格的,许多企业是两者并重的。注重用户增长意味着获客,获客没有哪个企业是不需要的,但是随着互联网的兴起,数据的兴起,获客在具体做法上有了很大的改变。
互联网刚兴起的时候,大家会发现网上获客又简单又便宜,比如在搜索引擎上投一投付费广告,或者做做SEO,效果很显著。
现在呢?网上的流量越来越贵,对于某些特定行业,比如汽车或者教育,一个销售线索的成本达到了几十甚至到几百人民币,所以如何在当下环境找到有效、便宜的方法来接触到更多的潜在消费者对企业来说是很重要的。
我们现在的做法是帮助客户量身打造一个精准获客的策略和完整的CRM(CustomerRelationship Marketing客户关系营销)解决方案。
首先了解到客户现有的获客流程,基于行业和客户自身特点提出解决方案,落地之后还可以通过与历史数据对比来看效果如何,在这个过程中我们又学习到什么,再去调整具体的操作或者实施步骤,形成闭环优化的结果。以某著名电脑品牌客户为例,原来的获客方法就是做线上线下活动,网上购买一些用户资源,但是我们可以帮他做细,我们可以通过模型来挑选出对品牌感兴趣的人群,在此基础上再做活动,省钱省力。
之后在转化阶段,原先客户的方法就是通过电话中心接触,或者直销的形式,我们可以丰富这些手段,比如可以结合数据来核实用户的真实意图和具体需求,在接触到的时候做到个性化推荐;或者可以用模型对这些用户做分群,之后再促进转化,都是非常好的方法。
Merkle CRM解决方案流程图
对于注重客户维系的企业,我们可以帮助企业建立用户价值和生命周期的体系。用户价值的主要目标是作为投资标准,而对用户的投资有多种形式:比如为高价值用户提供更频繁、便利的服务;在营销活动中为不同用户提供定制化的接触策略等。
我们在确定用户价值时会考虑很多因素,比如考虑到任期,流失,风险,营销和服务成本,交易历史以及预期的未来盈利能力和收入。而且用户价值会随着其生命周期的改变而改变,这是一个动态的过程,完全可以在这种变化中放大营销效果和增加决策正确性。还是举电脑行业的例子,我们可以结合用户历史购买/保修/网上浏览等行为,给每一个用户一个生命周期所在阶段,然后在合适的时间点接触到用户。
Q:能否给志在从事大数据行业的年轻人一些您的意见?
陈晨:我觉得从事大数据行业首先要可以沉得下心来,必须能够掌握一两种常用的数据分析工具,比如R,Python等,能够进行一定程度的编程,这样才能对数据理解和分析有一个直观的学习深入过程,也可以训练新人的数学和逻辑思维能力。
当然这是进入行业的基本前提。然后是要有一定的统计学基础和商业分析能力,能够迅速地从数据分析的结果中得出对商业运用或其他相关专业领域的洞察和应用方向。简单地说不是把模型跑出来,图表画出来就完事儿了,还需要能够从模型结果和数据可视化呈现中推断总结出后面真正的故事和意义。
在这些基本的能力和技能掌握后,要保持持续学习的心态,不断追随和了解行业最新动态和趋势,并能够横向进行多产业方向的融汇贯通。另外,大数据分析专业往往需要和不同部门,不同类型的客户进行沟通、讲解,所以如果在职业生涯的后端需要保持持续发展的竞争力,能用专业和非专业的语言和不同层次背景的合作方进行有效沟通也是必不可少的技能。
这次的访谈到此结束,谢谢陈晨分享关于数据整合/增强、数据分析和建模的一些项目经验。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09