
数据分析入门:初识数据埋点
计划将实际工作中最高频的与数据相关的一些工作经验以及技巧与大家做一个交流沟通,初步计划整体分6-8篇文章、每篇1-2周的频率由外到里,由浅入深,并伴随实际工作中案例系统性的分享。根据看官老爷的反应调整后面要写的内容,以及更新文章的速度。
埋点概述
数据埋点是数据产品经理、数据运营以及数据分析师,基于业务需求(例如:CPC点击付费广告中统计每一个广告位的点击次数),产品需求(例如:推荐系统中推荐商品的曝光次数以及点击的人数)对用户行为的每一个事件对应的位置进行开发埋点,并通过SDK上报埋点的数据结果,记录数据汇总后进行分析,推动产品优化或指导运营。
埋点分析,是网站分析的一种常用的数据采集方法。数据埋点分为初级、中级、高级三种方式。数据埋点主流部署的方式有:
私有化部署(即部署在自己公司的服务器上,如果期望提高数据安全性,或者定制化的埋点方案较多,则适合私有部署,并开发一套针对自己公司定制化的数据后台查询系统保证数据的安全性和精确性,缺点是成本较高)。
接入第三方服务,比如国内的某盟和国外的GA(Google Analytics)统计,在以后的文章中会单独介绍,此处不再展开。(优点是成本较低,部分基础服务免费,缺点是:数据会存在不安全的风险,另外一个就是只能进行通用的简单分析,无法定制化埋点方案)
此处只展开初级:在产品、服务转化关键点植入统计代码,据其独立ID确保数据采集不重复(如收藏按钮点击率);
主要的埋点事件分类:
点击事件:
点击事件,用户点击按钮即算点击事件,不管点击后有无结果;如下图红框标注所示,点击一次记一次。
曝光事件:
成功打开一次页面记一次,刷新页面一次记一次,加载下一页新页,加载一次记一次。home键切换到后台再进入页面,曝光事件不记;
页面停留时间事件:
表示一个用户在X页面的停留时长记为停留时长。例如:小明9:00访问了X网站首页,此时分析工具则开始为小明这个访问者记录1个Session(会话)。接着9:01小明又浏览了另外一个页面列表页,然后离开了网站(离开网站可以是通过关闭浏览器,或在地址栏键入一个不同的网址,或是点击了你网站上链接到其他网站的链接……)为了简单,我们把这个过程当做一个Session。
则最终小明在首页的页面停留时间:
(Time on Page,简称Tp)Tp(首页) = 9:01 – 9:00 = 1 分钟
When?什么时间做?
产品经理的需求来源众多,可能来自一线市场人员,可能来自身旁油腻的领导。可能来自用户反馈的一条吐槽…无论需求来自哪里,首先要搞清楚的就是这个需求涉及的问题:
在什么样的场景下?
面向哪些目标用户?
解决了哪些问题?
带来了什么价值?
梳理清楚问题后,拆分问题:
哪些是主要问题?
哪些是次要问题?
重不重要?
紧不紧急?
将每个问题拆解后下一步就是带着PRD文档找亲爱的数据分析师童鞋与产品经理汪一起沟通,解决以下问题:
每个问题应该怎么量化?
量化指标是什么?
怎么通过数据定义每个问题以及整个需求的成功与否?
有哪些辅助指标?
定义好数据指标后,此时则需要数据产品或者数据分析师定义埋点。
How?怎么定义埋点?
无规则不成方圆,良好的定义规范可以帮助埋点相关人员更好的维护,以及理解,极高的提升工作效率,降低推倒重来的风险,基于此分享一份埋点的定义规范帮助各位看官老爷以后维护自己产品的埋点。
使用此规范后,本汪一人就可以维护一个APP版本(包含点击事件、曝光事件、停留事件)累计1500多个埋点,井然有序,完全不会乱。
(怀念那些加班维护埋点跑数的日日夜夜,让我与看门大叔成了挚友,结下了深厚的友谊。咳咳,此处应该有掌声…)
埋点分类概述:
首先从事件属性这个维度上分为三份Excel(点击事件表、曝光事件表、停留事件表)
其次每一个事件表中新建三份子表(Sheet),以点击事件表为例拆分为:首页事件集合、列表页事件集合、详情页事件集合
每当APP发布新版本时,从上一个版本的埋点中做一份Copy,新版本中新增了哪些埋点,删除了哪些埋点?都用不同的颜色,或者时间标记进行标注说明。
真实环境中分类更为复杂,仅以上面例子说明分类思路,各位看官老爷可以根据业务需求做针对自己产品更合适的分类。
字段明细:
功能字段:
用于说明当前埋点是在哪个页面的哪个功能。例如:收藏功能,对应功能字段名:自定义为我的收藏
中文名字段:
用于描述X功能模块内X位置,例如起名叫:收藏功能-文章收藏
事件类型字段:
用于说明当前埋点是点击事件还是曝光事件还是其他
事件ID字段:
如果是自己公司开发的数据查询系统,则每一个埋点都对应一个事件ID,上线后用于拿着事件ID去后台取数使用。事件ID的命名规范:事件英文简写_哪一端的产品_产品名称简写_页面名称_模块名称_功能名称。
例如:点击事件_APP端_二手车_个人中心_收藏_文章收藏 对应事件ID== click_app_2sc_ Personal Center_ Collection_ Article Collection
如果是用的第三方统计工具:例如某盟,同理定义好事件ID,上线后去X盟后台,输入事件ID查询相应的数据。
当一个埋点对应不同类型的多种位置的埋点时,则需要命名当前埋点的key参数与value参数,一个key可以对应1个value或者多个value,但一个value不能对应多个key.只能对应唯一的一个key 例如:二手车信息网站有2个关键按钮,一个是砍价按钮,一个是拨打电话按钮,但是在多个频道中每个频道都有多个砍价按钮多个拨打电话按钮,在这样的场景下就可以设计2个KEY值:
key01=source用于标记当用户点击了一次按钮后是在哪个频道的页面点击的这个按钮X value01=X1,value2=X2用于标记不同位置同属性的按钮。
Key02=type用于标记用户是点的砍价还是点的拨打电话按钮,例如:01value用于标记砍价按钮,02value对应的拨打电话按钮。
记录规则字段:
定义什么情况下触发埋点,例如:在列表页点击一次记录一次
备注:
用于描述当前埋点什么时间新增?什么时间修改过?原因?什么时间被删除?谁删除的?等信息记录,此处好多看官可能以为写不写无所谓,但是为了信息的完整性和可追溯性最好每一次变动都要备注。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01