京公网安备 11010802034615号
经营许可证编号:京B2-20210330
网站数据分析:那些难以实现的细分_数据分析师
如果你从事网站分析相关工作,那么你一定用过或听说过网站分析工具中的细分(Segment)功能。不得不说,用好Segment是一名合格的网站分析师必备的技能。关于Segment的重要性,恐怕无需我多言了,借用Sidney的一句话——“无细分,毋宁死!”
However,这次想跟大家分享的,是那些我认为难以实现的细分。这里需要强调下,只是“我认为”,并未向任何官方证实我的这些想法,因此请大家尽管质疑,尽管拍砖。
在用具体的案例来说明问题之前,先简单回顾下细分是如何工作的,下面引用一段Omniture官方文档中的内容,
Segmentation works by scanning through every single hit within the time period selected, checking to see if that image request matches your segmentation rules.
1. If it matches, then that hit will be part of your segment (along with additional data depending on the bucket)
2. If it does not match, the image request is thrown away and treated as if it didn’t exist in the context of the specific report you are viewing
这里要注意下,虽然平时如果你说“把Search Engine按Keyword细分”,大家都明白你的意思,但实际上,很可能潜移默化地就把多维度关联和细分两者的概念混淆了。
好了,废话不多说,直接进入正题。
在同一个会话(Session)中,用户可能对Page A产生了X个Page View(s),那么,是否可以通过细分,得到可以满足下表的数据?
| Page Views of Page A | Visits |
| 0(未查看过Page A的访问) | |
| 1(查看过Page A 1次的访问) | |
| 2(查看过Page A 2次的访问) | |
| … | |
| X(查看过Page A X次的访问) |
我们先尝试第一项,0 Page Views of Page A(未查看过Page A的访问),
很容易地,我们给出了细分规则,即在所有的数据中筛选出排除了访问中访问过Page A的访问(似乎稍有拗口,在用文字表达细分规则的时候我总感觉很吃力,语言难以规范,请见谅了)。也就是说,如果某次访问中包含了Page = Page A的hit,那么,这次访问将不在细分后的数据集中。
事实上,得到这个数据如果不通过细分来实现,也是非常容易,用Total Visits – Visits of Page A,得到的结果便是完全没有访问过Page A的Visits了。
细分后,我们来看看Page A的数据情况,顺便验证下细分是否正确,
(图片已经PS处理,数据为模拟数据)
如上图所示,细分后得到的Total Visits 是9,310,750,而未细分的话,得到的Total Visits是10,041,929,两者之差正好是未细分时Page A的Visits 731,179,因此,细分成功。
顺便提一下,不要试图用下面的规则来得到这个数据,也不要试图把Visit Container修改成Page View Container,想一想为什么吧,我就先不多说了。
接着,我们继续尝试第二项任务,即细分出“看且仅看了Page A 1次的访问”。
我们可能试图用以下规则来实现,
乍一看,还真像那么回事,我们先直接看看结果如何,
(图片已经PS处理,数据为模拟数据)
有没有发现,我们所期望的“看且仅看了Page A 1次的访问”,其结果竟然与Page A Single Page Visits(访问且仅访问了Page A的访问数量)相同,这说明我们的规则:Page Views equals 1,作用于整个visit,限定了符合规则的访问必须仅包含1个Page View,而并非如我们所愿,用于限定Page A的Page Views为1 。
到这里,我想实验可以结束了,之后的任务也同样无法完成了。由于近两年较少使用GA,因此我并不确定GA中是否可以实现这样的细分,但是对于Omniture,我有至少99%的Confidence说这个细分是无法实现的(经过针对性的部署的除外)。
还没完,来试试总结出一个更具普遍性的结论:我们可以细分出某个特定变量发生过特定次数的访问/访客,但无法细分出某个特定变量的某个特定值发生过特定次数的访问/访客。
用这个结论来解释这个案例的话,那就是我们可以细分出Page变量发生过X次(Page Views = X)的访问,但无法细分出Page变量的值为A且发生过X次Page=A的访问。
这个案例就到这里结束了,如果你有任何不同意见,请尽管拍砖,我虽然很坚信这个细分确实无法实现,但我更希望我的想法是错误的。文章来源:CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01