京公网安备 11010802034615号
经营许可证编号:京B2-20210330
移动设备的用户行为数据如何追踪
关于移动设备如何监测用户的行为,看似容易,其实不容易。容易的是,如果把移动设备就当成桌面PC,那么其实无论是对App还是对Web,都可以沿用目前在PC上的方式:Page Tagging和Event Tracking。但问题在于移动设备存在更多的灵活性,人们不止使用一个设备,人们还在移动设备和桌面设备之间切换,而且人们还在web和app之间切换。这样,一个人所发生的跨域和跨界的行为就太多了,如果监测不到这些“跨”行为,我们的监测就无法准确。后PC时代,互联网用户的监测也面临新的课题和挑战。

在今年的SEMPO会议上,我有30分钟的演讲,介绍这个话题。不过时间太短,很难展开,但很明显在场的听众非常感兴趣。因此,我又觉得该有文章研究一下这个领域,在这个文章和下个文章中,我将介绍我所了解到的方法。
这一篇文章,来自于美国同行专家Kevin Trilli的一篇文章,原文题目是《Mobile Tracking: How it works and why it’s different》,我请我的朋友Ptmind的李莹同学帮我做了全文的翻译。非常感谢她的全情帮助!这篇文章不容易,但翻译的非常有水准!文中没有引号的部分是我的注解。
【正文】
“本质上,移动业务的数据监测和我们常见的网站监测在原理上基本共通。举个典型的例子,我们都想要能够贯通各域的跨站监测,但是这种跨站监测的标识信息存活周期偏偏太短,所以我们不得不使用能够存活更久的单域标识来进行监测。然而,在移动监测的世界里,还有一些小波澜会让这些事情变得更加棘手。
“下文将讲述一些移动监测所使用的技术,并且会强调这些技术和我们传统的线上监测有何不同。其实,当下已经有不少移动广告投放商在对用户进行着标识和监测。简洁起见,下文假设我们是通过广告网络(Ad Network)发放广告,并进行相关的监测追踪。不过这并不代表在只有广告网络才会使用这些技术,在这个供应链中,当然还有其它的使用者。另外还要声明的是,尽管不乏有人担忧移动广告运营链中所采集的用户信息会涉及威胁用户隐私,但本文所述的广告商以及本文意指阐述的内容,都绝对不会涉及任何个人可识别信息进行行为分析,此外,在推广频率和独立用户数的计算方面,对用户信息的使用也做出了最大限度的保护和最有限程度的使用。
“移动广告网络所面临的一大挑战,就是移动广告的受众对象同时使用着移动网站和App(指mobile application,即移动应用,下同)两种内容媒介。在移动设备上,App和网站分属不同的域,被不同的沙盒所分隔,也使用着不同的标识信息。对于广告网络,这就意味着同一个用户可能被拆分成多个统计形象,广告网络还需要另寻他法将这些不同的识别信息整合到一起。对于这些方法,后文将有详述。
“我们先来谈谈移动App。对于App,开发者们会调用基于操作系统的标识符来标记独立用户。放眼Android和iOS两大巨头平台,两家分别使用了Android_ID和UDID来做这个事情。安卓同时还支持更多的系统标识信息,包括设备身份码(例如IMEI,MEID或ESN,根据网络不同而异),对于电话设备,可提供用户识别码(SIM卡上的IMSI码),如果设备支持WIFI,还能够提供WLAN MAC地址(iOS上也有这项信息)。这些基于操作系统的标识符着实令广告网络中的各位欣喜若狂,因为无论APP的开发者是谁,这个标识符都不会变。这样一来,太可以实现跨应用追踪独立用户。
“不过,这种情况下用户基本上没什么自主权逃离监控,于是这一现象促使Apple在iOS5之后开始弃用了UDID。不过,所谓弃用并不代表开发者和广告网络没有办法再用它(他们的确还在用),但Apple强调了不建议开发者使用UDID,并且也意味着在未来的版本中有可能将UDID废除(彻彻底底的告别)。(译注:目前UDID已经废除,2013年年中,新提交的涉及使用UDID的APP已无法通过审核,只有此前提交的仍然可以使用。)
失去了UDID,Apple转而鼓励开发者们自行建立独立用户标识信息。不过当然,这救不了需要贯通信息的广告网络。为了达到跨应用检测,大家想到不少曲线救国的方案,但同样面临到和Apple弃用UDID同样的隐私担忧。
“接下来我们看看移动网站(mobile web)的情况,和传统线上网站一样,对于跨域监测我们采用的是第三方cookie(书作者注:对于自己网站上用户行为的监测,则还是使用了第一方cookie,原理跟前面谈到的client side tracking方法是完全一样的)。但和传统线上网站不同的是,由于移动设备上缺乏安全软件,广告网络对第三方cookie能写能查。第三方cookie在Android设备上是有效的。常规的Android用户习惯只去使用预装好的浏览器或者将特定的浏览器设成默认,而不再更换其他浏览器。而作为Apple的预装浏览器,Safari的第三方cookie默认设成了关闭,这也就意味着广告网络没法在Apple设备上进行跨域监测。不过,广告网络也采用了一些其它方法来监测iPhone和iPad用户的访问会话。
“一种方法是取巧于Safari浏览器的一项安全漏洞,如果广告网络运营者能够在页面中嵌入一个透明的iframe,就可以植入cookies。这项由斯坦福大学的毕业生Jonathan Mayer做出的发现一度引起了广泛关注。另一种方法,是去采集浏览器本身披露的信息,为该设备建立一份“指纹档案”。结合浏览器的使用程度、是否支持Javascript等所获信息程度不同,最乐观能达到94%的准确度。
“还有一种方法,是结合存活期较长的单一域标识信息(长期标识),并借助一个临时的跨域标识符来帮助广告网络达成所需目的。这个长期标识和第一方cookie关联(一对一映射),会在请求广告时作为一种UID信息传递给广告网络。在一次访问周期内,我们可以使用一些在用户访问期间能够保持不变的信息作为临时踏板,例如IP地址,或者通过移动运营商的WAP网关(所有的浏览器会话都会通过WAP网关进行传输)传递的标识符。这样多个网站可以在一个visit周期内被关联起来,被记录为是这个访问者浏览过的网站。而在下一次访问周期内,访问者的IP地址或者WAP网关可能跟第一次访问时不一样了,我们该如何把下一次访问跟前一次访问关联起来归到这一个访问者(而不是两个访问者)呢?为了能够辨别这仍然是前一次的某个访问者,我们观察新一次访问到的所有网站中记录的第一方cookie有没有跟之前的访问网站记录相匹配的。在下图的例子中,正好有这样的情况。这个访问者在第一次访问中访问了Publisher 1、2、3;而第二次访问中访问了Publisher 1、5、19。由于每个网站都有第一方cookie,而两次访问又正好都访问了Publisher 1,因此可以通过publisher 1的第一方cookie知道两次访问是同一个访问者又回来了。并且我们也就可以知道,Publisher 1、2、3、5和9都是这一个访问者浏览的。根据运营商的不同以及运营商和广告商的关系,这个网关识别符存活期可长可短,理想情况下这个标识符可能永远不变。不过显然,这项技术只对于用户常常访问的网站才有效,而且广告网络也基本没办法实时使用这些信息。这种方法可以和数字指纹结合使用,能够提高指纹的准确性或减少生成指纹所需的计算次数。下图对上述方法进行了示例:
“不过,如果正好有访问者玩儿了App,又过了会儿上了网(通过手机浏览器),那么该如何辨识他们是同一个人呢?
“如上文所述,移动网站和APP分属不同的域,也各自使用着不同的标识符。从广告商的角度来看,这意味着用着同一台设备的同一个人,却被分离成了两个。从用户的角度来看,这不忠实于用户所选的拒绝追踪设置(包括监测和行为分析),明明在一个域下进行过追踪设置(例如在浏览器中停用了Cookie或设置了禁止追踪),在另一个域下却未被识别,因为广告网络也分辨不出来这是之前设置过拒绝追踪的那个人。而且App和网站页面之间为什么常常会跳来跳去,这也让人难以理解。
“将App和移动网站关联起来的最常见方法,通常是在用户点击一个App内的广告时生效的。用户点击的这个广告时指向目的地的URL对于该用户而言是唯一的,它带有一个能够映射到App域下用户标识符的URL后面的参数,而这个URL和参数,对于同一个设备上浏览网页时的相同广告主的广告,也是一样。即无论在App上做广告,还是在web上做广告,广告的URL后面的参数都必须一样,且这个URL用来标识这个用户。当用户转跳到了广告主的网站上,广告网络就能通过URL尾参中的标识符将App域下的标识符和网站的关联到一起。广告网络也会通过各种技术进行反向定位(举一个重要的使用场景:当用户在网站上看到一个关于新App的广告,例如最新、最酷的游戏,广告网络想要知道这个用户是否最终动心点击广告并且真正完成了下载。)不过,这些技术的应用前提是广告网络能够访问两种不同域下共有的存储信息,各操作系统对此的门槛也高低不同。”
我的评注:
这个文章所描述的,是目前移动营销数据监测的一个缩影。移动终端比PC先天好的地方在于,有类似UDID或者IMEI这样的永久性标识来锁定一个设备,这使我们对于unique类数据(例如unique impression,unique click,unique visitor等)的追踪显得更加容易。但这些永久性标识却存在较大的隐私争议,而造成应用范围的不断萎缩。但如果没有这些永久标识,追踪unique类数据就比PC更麻烦了。这种情况下我们仍然不得不求助于cookie,第一方的和第三方的(事实上mobile cookie和web cookie实现方法是不同的,但它们的作用几乎一样,所以也被开发者沿用了cookie的名称),即使是在App中,我们也用曲线救国的方法装入cookie。
但cookie也遇到了问题,除了仍然让人心烦意乱的隐私问题,另一个麻烦是在用户体验上的,iOS系统下,可能会造成用户在点击进入App时,突然被踢出App,打开一个浏览器,然后又被踹回App的体验。Apple也在开始禁止开发者使用cookie追踪技术。
上面的原理全部集中在如何进行用户辨识和跨域(以及跨界,即跨web和app)上,那么如何辨识web上或是App上用户的具体行为呢?
从mobile web的角度看,与PC上的web的用户行为追踪原理没有太大的不同,同样需要依赖于cookie,或至少得用pixel tracking的方法(关于什么是pixel tracking,我正在写的书中间会详细说明)。而App内用户行为的追踪最常用的方法是通过SDK(软件开发工具包)在App内放置监测程序的头文件、库和其他模块,同时对你感兴趣的用户交互行为单独加上代码进行追踪,这颇像我们后面小节中要讲到的event tracking(事件追踪)的方法。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18