京公网安备 11010802034615号
经营许可证编号:京B2-20210330
网站数据分析:那些难以实现的细分_数据分析师
如果你从事网站分析相关工作,那么你一定用过或听说过网站分析工具中的细分(Segment)功能。不得不说,用好Segment是一名合格的网站分析师必备的技能。关于Segment的重要性,恐怕无需我多言了,借用Sidney的一句话——“无细分,毋宁死!”
However,这次想跟大家分享的,是那些我认为难以实现的细分。这里需要强调下,只是“我认为”,并未向任何官方证实我的这些想法,因此请大家尽管质疑,尽管拍砖。
在用具体的案例来说明问题之前,先简单回顾下细分是如何工作的,下面引用一段Omniture官方文档中的内容,
Segmentation works by scanning through every single hit within the time period selected, checking to see if that image request matches your segmentation rules.
1. If it matches, then that hit will be part of your segment (along with additional data depending on the bucket)
2. If it does not match, the image request is thrown away and treated as if it didn’t exist in the context of the specific report you are viewing
这里要注意下,虽然平时如果你说“把Search Engine按Keyword细分”,大家都明白你的意思,但实际上,很可能潜移默化地就把多维度关联和细分两者的概念混淆了。
好了,废话不多说,直接进入正题。
在同一个会话(Session)中,用户可能对Page A产生了X个Page View(s),那么,是否可以通过细分,得到可以满足下表的数据?
| Page Views of Page A | Visits |
| 0(未查看过Page A的访问) | |
| 1(查看过Page A 1次的访问) | |
| 2(查看过Page A 2次的访问) | |
| … | |
| X(查看过Page A X次的访问) |
我们先尝试第一项,0 Page Views of Page A(未查看过Page A的访问),
很容易地,我们给出了细分规则,即在所有的数据中筛选出排除了访问中访问过Page A的访问(似乎稍有拗口,在用文字表达细分规则的时候我总感觉很吃力,语言难以规范,请见谅了)。也就是说,如果某次访问中包含了Page = Page A的hit,那么,这次访问将不在细分后的数据集中。
事实上,得到这个数据如果不通过细分来实现,也是非常容易,用Total Visits – Visits of Page A,得到的结果便是完全没有访问过Page A的Visits了。
细分后,我们来看看Page A的数据情况,顺便验证下细分是否正确,
(图片已经PS处理,数据为模拟数据)
如上图所示,细分后得到的Total Visits 是9,310,750,而未细分的话,得到的Total Visits是10,041,929,两者之差正好是未细分时Page A的Visits 731,179,因此,细分成功。
顺便提一下,不要试图用下面的规则来得到这个数据,也不要试图把Visit Container修改成Page View Container,想一想为什么吧,我就先不多说了。
接着,我们继续尝试第二项任务,即细分出“看且仅看了Page A 1次的访问”。
我们可能试图用以下规则来实现,
乍一看,还真像那么回事,我们先直接看看结果如何,
(图片已经PS处理,数据为模拟数据)
有没有发现,我们所期望的“看且仅看了Page A 1次的访问”,其结果竟然与Page A Single Page Visits(访问且仅访问了Page A的访问数量)相同,这说明我们的规则:Page Views equals 1,作用于整个visit,限定了符合规则的访问必须仅包含1个Page View,而并非如我们所愿,用于限定Page A的Page Views为1 。
到这里,我想实验可以结束了,之后的任务也同样无法完成了。由于近两年较少使用GA,因此我并不确定GA中是否可以实现这样的细分,但是对于Omniture,我有至少99%的Confidence说这个细分是无法实现的(经过针对性的部署的除外)。
还没完,来试试总结出一个更具普遍性的结论:我们可以细分出某个特定变量发生过特定次数的访问/访客,但无法细分出某个特定变量的某个特定值发生过特定次数的访问/访客。
用这个结论来解释这个案例的话,那就是我们可以细分出Page变量发生过X次(Page Views = X)的访问,但无法细分出Page变量的值为A且发生过X次Page=A的访问。
这个案例就到这里结束了,如果你有任何不同意见,请尽管拍砖,我虽然很坚信这个细分确实无法实现,但我更希望我的想法是错误的。文章来源:CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
尊敬的考生: 您好! 我们诚挚通知您,CDA Level III 考试大纲将于 2025 年 12 月 31 日实施重大更新,并正式启用,2026年3月考 ...
2025-12-31“字如其人”的传统认知,让不少“手残党”在需要签名的场景中倍感尴尬——商务签约时的签名歪歪扭扭,朋友聚会的签名墙不敢落笔 ...
2025-12-31在多元统计分析的因子分析中,“得分系数”是连接原始观测指标与潜在因子的关键纽带,其核心作用是将多个相关性较高的原始指标, ...
2025-12-31对CDA(Certified Data Analyst)数据分析师而言,高质量的数据是开展后续分析、挖掘业务价值的基础,而数据采集作为数据链路的 ...
2025-12-31在中介效应分析(或路径分析)中,间接效应是衡量“自变量通过中介变量影响因变量”这一间接路径强度与方向的核心指标。不同于直 ...
2025-12-30数据透视表是数据分析中高效汇总、多维度分析数据的核心工具,能快速将杂乱数据转化为结构化的汇总报表。在实际分析场景中,我们 ...
2025-12-30在金融投资、商业运营、用户增长等数据密集型领域,量化策略凭借“数据驱动、逻辑可验证、执行标准化”的优势,成为企业提升决策 ...
2025-12-30CDA(Certified Data Analyst),是在数字经济大背景和人工智能时代趋势下,源自中国,走向世界,面向全行业的专业技能认证,旨 ...
2025-12-29在数据分析领域,周期性是时间序列数据的重要特征之一——它指数据在一定时间间隔内重复出现的规律,广泛存在于经济、金融、气象 ...
2025-12-29数据分析师的核心价值在于将海量数据转化为可落地的商业洞察,而高效的工具则是实现这一价值的关键载体。从数据采集、清洗整理, ...
2025-12-29在金融、零售、互联网等数据密集型行业,量化策略已成为企业提升决策效率、挖掘商业价值的核心工具。CDA(Certified Data Analys ...
2025-12-29CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-26在数字化转型浪潮下,审计行业正经历从“传统手工审计”向“大数据智能审计”的深刻变革。教育部发布的《大数据与审计专业教学标 ...
2025-12-26统计学作为数学的重要分支,是连接数据与决策的桥梁。随着数据规模的爆炸式增长和复杂问题的涌现,传统统计方法已难以应对高维、 ...
2025-12-26数字化浪潮席卷全球,数据已成为企业核心生产要素,“用数据说话、用数据决策”成为企业生存与发展的核心逻辑。在这一背景下,CD ...
2025-12-26箱线图(Box Plot)作为数据分布可视化的核心工具,凭借简洁的结构直观呈现数据的中位数、四分位数、异常值等关键信息,广泛应用 ...
2025-12-25在数据驱动决策的时代,基于历史数据进行精准预测已成为企业核心需求——无论是预测未来销售额、客户流失概率,还是产品需求趋势 ...
2025-12-25在数据驱动业务的实践中,CDA(Certified Data Analyst)数据分析师的核心工作,本质上是通过“指标”这一数据语言,解读业务现 ...
2025-12-25在金融行业的数字化转型进程中,SQL作为数据处理与分析的核心工具,贯穿于零售银行、证券交易、保险理赔、支付结算等全业务链条 ...
2025-12-24在数据分析领域,假设检验是验证“数据差异是否显著”的核心工具,而独立样本t检验与卡方检验则是其中最常用的两种方法。很多初 ...
2025-12-24