京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析在应用场景下究竟可以做什么?
数据分析在基本应用场景下,我们现在能用数据干些什么呢?基于我在 eBay 和 Linkedin 工作的几年,做了很多数据分析的场景,跟大家分享一下。
第一“数据分析师”可以用数据获取用户,今天上午我们有客户也谈到市场营销 SEM 的解决方案,采用了 GrowingIO 的软件和分析解决方案,大概在两个星期就实现了市场营销的分析。
第二个产品的互动,就是指当用户登陆网站使用产品的时候,用户用的是不是很爽,很流畅,很简单。我们可以通过数据分析来优化产品体验。
第三个付费转化,一开始很多网站会吸引用户免费使用产品,我们如何能够缩短时间,快速把免费用户转化成为付费用户,这个周期可长可短。
第四个是客户留存,客户变成我们的客户之后,能够持续的使用,不要流失。因为我们发现获取新用户的成本比挽留一个老用户的成本要高。
我把这四个点简单概括成几个字。第一是拉新,找到新用户。第二是盘活,我们有产品,希望用户的使用非常地活跃。第三是转化,希望从免费变成付费。第四是留存,不希望这个客户/用户流失。
一、拉新
作为大数据的解决方案来说,是能够发现所有线上的入口。我们需要跟踪市场营销的每一个渠道,在每个渠道投入多少资源,回报是怎样的。我们要跟踪用户在哪个渠道,哪个购买入口,在哪一个点,成功的转化。也就是计算渠道的效率是什么样的,衡量每个渠道的转化率,资源投放是多少。
客户的区隔。主要是在做市场营销的时候希望能够降低营销成本,能够把不同的客户区分出来,在区分客户之后,用不同的打法去给客户做一些市场营销的手段。比如说是有邮件的方式,有社交网络推送的方式等等,还是说要找销售直接去跟客户聊。
最重要要有一个 ROI 工具。ROI 算法就是你要能够清楚的计算出来,这个市场营销的投入和产出到底是多少。
这里有两个层次,第一个层次,你作为企业,你去做市场营销,你要知道你自己的 ROI。第二个层次,你企业平台上还有你服务那些客户的 ROI,你能不能算出来。就是你的这些客户在使用你提供的产品,如何能够证明说,你的客户在使用了在你的平台软件和服务之后,在为客户创造价值,创造了多少价值。
简单讲一个 Linkedin 的例子。用户在 Linkedin 上搜索企业信息或者申请职位,或者他跟随一个公司,或者说他的简历被搜索了一次,这些主动的,被动的,公司与个人,个人与个人的交互,总共大概是 300 亿的级别,网站上 3 亿多用户之间的所有交互。
我们做了一个大数据分析,然后我们能够把这个 ROI 算出来,从而我们计算出来一个叫做企业雇主品牌指标,这个指标可以衡量企业对于全球所有的人才的吸引指数是多少,这是有一个全球的排名,会非常有意思。中国的一些企业想在走国际化道路,希望提高企业品牌在全球的影响,这个指标特别能帮助中国企业吸引国际化人才。
二、盘活
产品,最重要是让用户在你网站上使用非常流畅。怎么样说流畅不流畅,我们需要知道用户,在你网站中或者在你的移动应用当中,它的每一个操作,它的每一次交互,都有一条记录在那里,就是我之前说的时间、地点、人物、内容和交互方法。
再说一下用户画像,比如用户的性别、年龄、收入等等,但这些是用户的基本画像。还有一些更深层次的,比如说用户的行为,他最近一段时间登陆了我们网站多少次,使用了我们的移动应用多少次,它最近这段时间购买了多少商品,或者他在您的移动 APP/网站中搜索了多少次,这些都是用户自发的行为,他主动的行为。
美国有一家做视频播放的网站 Netflix,他们在一段时间内,有两种盈利方式一个是租 DVD,一种方式是线上的视频播放,他们把 DVD 业务全部砍掉,因为这部分很难掌握用户观看视频的行为,而且用户行为是不会欺骗你的,比如说用户注册的时候,有个选项让用户输入喜好的影片类型,比如动作、恐怖、科幻、动画,当你开始写的这些东西并不是符合你的用户行为,真正行为还是在海量数据当中,海量的历史记录当中把它提炼出来,才会知道你这个用户真正的倾向性和喜好是什么,然后大数据才会正确的给您推送你喜欢的内容。
比如说国内非常著名的媒体公司“今日头条”,他们在推送方面就做得非常好。
核心 KPI,我们如果能够了解客户所有行为之后,可以快速制定这些核心 KPI,能够知道我们企业的健康度。
我们之前在没有大数据处理技术能力的情况下,我们经常做的是,采样,或者拿小部分数据先算一下。但当这个数据量非常大的时候,比如说 Linkedin 全球有 3 亿多用户,这 3 亿多用户,我们想做用户级别的归类。我看了用户简历,想知道这个人是不是销售,这个人是不是 HR,就是你很难通过简单的方法来定论,那么我们就需要去做大数据模型。
之后我们就会有一些发现,我们之前的假设和我们最后的发现会非常有意思,你可以找到非常多的你意想不到的洞察(insights)。比如说我们在判别一个用户的简历,最后发现只要有这个关键字,他就一定是销售,这也是我们意外收获,这个关键字是一家加拿大销售公司培训的名称,只要有这个关键字,这个人是销售的概率就非常高,所以假设检验在大数据技术力的推动下,能够发现你以前未知的那些数据。
三、转化
再讲讲销售,首先我觉得这五个步骤不仅仅适用于对企业的销售,像包括建立网站和社区,我们都需要把用户不断的转化。
首先,最重要的一点,就是我们有那么多潜在的客户,哪个客户使最重要的,这点可以通过它在网站,APP 上蛛丝马迹的行为进行判断。还有一个,以前在公司里需要派哪个客户去跟雅或者亚马逊接触。下面还需要通过数据理解这个公司谁是决策人。再接着需要通过内部网络社交关系,哪个人认识决策者,能让他买我们的产品。
最后是如何用数据讲一个真实的故事让客户有更高的信息来采购我们的产品。
这五个步骤全部可以用数据驱动,而且驱动的速度是以前别人认为可能需要两个星期,三个星期的决策周期,今天我们可以用在一分钟之内就可以实现,这就是数据科学,技术力给我们带来的价值。
四、留存
如何促进用户留存?实际上客户的留存通过他的很多微妙的行为,跟我们讲的很多的很好的故事。
我们以前做了很多这样的模型,后来发现真正流失的用户在非常早期就已经释放这种信号。因为用户有几个生命周期,整个流程有生命周期的,往往用户在早期很微妙的行为的加权,就能知道这个客户会在未来哪个时间点会流失。
这是我们"数据分析师"两三年来做用户的模型,慢慢的把留存的模型的时间线不断的往前提前,最早预算用户流失的时候,立刻发信息。后来发现用户使用好的时候问他怎么用,这样留存率提高了 10%。还有在教育的时候是不是要对客户进行培训,各种引导、辅助,后来发现客户的留存度增加了非常非常多。LinkedIn 财报中写到,大概从 50% 流失率降到 20% 的流失率。这些都是数据和运营相结合的一个很好的过程。
大家想想我们以前工作很长时间,只能体现产品 10% 的价值,90% 的时间都浪费在数据采集,数据整合,数据清洗上面了。
今天公司很多人能做到数据决策,能做到这点就需要我们用先进的工具技术,分析理念,结合先进的业务的方法论,把下面的时间尽量的做到全自动化。大家想想我们节省了 90% 的时间,如果能把这部精力用在金字塔尖上的话,我们将产出更多的效益。
实际上在我以前的工作经验里看到,当我们用新兴的技术把底部做小,或者用新型的工具、产品把底部的工作做到多快好省,这会给企业提供高价值。孙子兵法有一句话,叫庙算胜者,得算多也,庙算不胜者,得算少也,多算胜,少算不胜。就是不去做数据分析,不去做决策,是很难在这种高密度竞争环境下生存。
所以我们"数据分析师"一定要想办法把数据分析做到全自动化。这就是我们今天的发展方向。
在美国数据决策可能起步早一点,很早就开始注重数据分析。那么在中国很多企业,特别像 BAT,这种大型的互联网公司,他们在数据分析上已经起步很早了。
整个数据分析,其实是金字塔框架。最下层是我们的用户,然后我们有市场,有产品,有销售,我们需要通过一定的方法把这些数据收集上来,然后对数据做数据平台,可能是技术团队做了大数据的。在这之上,我们去做一些专题的分析,比如说销售的分析,市场的分析,产品的分析,运维的分析等等,商业智能是做一些报表跟踪,再之上是深度分析、商业洞察、决策和行动。
整个这一套数据分析团队和架构,大部分企业花了很多的人力物力去解决下面金字塔的底部,因为数据的埋点、整合、清理需要大量的人力。
如何能把大数据分析自动化,能把大数据变成小数据,能把非常慢的数据的处理,变成非常快的数据处理,能够把非常麻烦的这些非结构化的数据,看不懂的数据结构化,自动的做好这 90% 的工作。
让我们企业内部懂业务的那些人:产品经理,业务端的人,他们在第一线接触客户,接触产品,他们最想知道企业业务的健康程度或者企业的主要问题在哪里,我们可以能够解放他们,让他们直接看到数据并分析这些数据,这就是 GrowingIO 所做的工作。数据分析师培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15