京公网安备 11010802034615号
经营许可证编号:京B2-20210330
移动设备的用户行为数据如何追踪
关于移动设备如何监测用户的行为,看似容易,其实不容易。容易的是,如果把移动设备就当成桌面PC,那么其实无论是对App还是对Web,都可以沿用目前在PC上的方式:Page Tagging和Event Tracking。但问题在于移动设备存在更多的灵活性,人们不止使用一个设备,人们还在移动设备和桌面设备之间切换,而且人们还在web和app之间切换。这样,一个人所发生的跨域和跨界的行为就太多了,如果监测不到这些“跨”行为,我们的监测就无法准确。后PC时代,互联网用户的监测也面临新的课题和挑战。

在今年的SEMPO会议上,我有30分钟的演讲,介绍这个话题。不过时间太短,很难展开,但很明显在场的听众非常感兴趣。因此,我又觉得该有文章研究一下这个领域,在这个文章和下个文章中,我将介绍我所了解到的方法。
这一篇文章,来自于美国同行专家Kevin Trilli的一篇文章,原文题目是《Mobile Tracking: How it works and why it’s different》,我请我的朋友Ptmind的李莹同学帮我做了全文的翻译。非常感谢她的全情帮助!这篇文章不容易,但翻译的非常有水准!文中没有引号的部分是我的注解。
【正文】
“本质上,移动业务的数据监测和我们常见的网站监测在原理上基本共通。举个典型的例子,我们都想要能够贯通各域的跨站监测,但是这种跨站监测的标识信息存活周期偏偏太短,所以我们不得不使用能够存活更久的单域标识来进行监测。然而,在移动监测的世界里,还有一些小波澜会让这些事情变得更加棘手。
“下文将讲述一些移动监测所使用的技术,并且会强调这些技术和我们传统的线上监测有何不同。其实,当下已经有不少移动广告投放商在对用户进行着标识和监测。简洁起见,下文假设我们是通过广告网络(Ad Network)发放广告,并进行相关的监测追踪。不过这并不代表在只有广告网络才会使用这些技术,在这个供应链中,当然还有其它的使用者。另外还要声明的是,尽管不乏有人担忧移动广告运营链中所采集的用户信息会涉及威胁用户隐私,但本文所述的广告商以及本文意指阐述的内容,都绝对不会涉及任何个人可识别信息进行行为分析,此外,在推广频率和独立用户数的计算方面,对用户信息的使用也做出了最大限度的保护和最有限程度的使用。
“移动广告网络所面临的一大挑战,就是移动广告的受众对象同时使用着移动网站和App(指mobile application,即移动应用,下同)两种内容媒介。在移动设备上,App和网站分属不同的域,被不同的沙盒所分隔,也使用着不同的标识信息。对于广告网络,这就意味着同一个用户可能被拆分成多个统计形象,广告网络还需要另寻他法将这些不同的识别信息整合到一起。对于这些方法,后文将有详述。
“我们先来谈谈移动App。对于App,开发者们会调用基于操作系统的标识符来标记独立用户。放眼Android和iOS两大巨头平台,两家分别使用了Android_ID和UDID来做这个事情。安卓同时还支持更多的系统标识信息,包括设备身份码(例如IMEI,MEID或ESN,根据网络不同而异),对于电话设备,可提供用户识别码(SIM卡上的IMSI码),如果设备支持WIFI,还能够提供WLAN MAC地址(iOS上也有这项信息)。这些基于操作系统的标识符着实令广告网络中的各位欣喜若狂,因为无论APP的开发者是谁,这个标识符都不会变。这样一来,太可以实现跨应用追踪独立用户。
“不过,这种情况下用户基本上没什么自主权逃离监控,于是这一现象促使Apple在iOS5之后开始弃用了UDID。不过,所谓弃用并不代表开发者和广告网络没有办法再用它(他们的确还在用),但Apple强调了不建议开发者使用UDID,并且也意味着在未来的版本中有可能将UDID废除(彻彻底底的告别)。(译注:目前UDID已经废除,2013年年中,新提交的涉及使用UDID的APP已无法通过审核,只有此前提交的仍然可以使用。)
失去了UDID,Apple转而鼓励开发者们自行建立独立用户标识信息。不过当然,这救不了需要贯通信息的广告网络。为了达到跨应用检测,大家想到不少曲线救国的方案,但同样面临到和Apple弃用UDID同样的隐私担忧。
“接下来我们看看移动网站(mobile web)的情况,和传统线上网站一样,对于跨域监测我们采用的是第三方cookie(书作者注:对于自己网站上用户行为的监测,则还是使用了第一方cookie,原理跟前面谈到的client side tracking方法是完全一样的)。但和传统线上网站不同的是,由于移动设备上缺乏安全软件,广告网络对第三方cookie能写能查。第三方cookie在Android设备上是有效的。常规的Android用户习惯只去使用预装好的浏览器或者将特定的浏览器设成默认,而不再更换其他浏览器。而作为Apple的预装浏览器,Safari的第三方cookie默认设成了关闭,这也就意味着广告网络没法在Apple设备上进行跨域监测。不过,广告网络也采用了一些其它方法来监测iPhone和iPad用户的访问会话。
“一种方法是取巧于Safari浏览器的一项安全漏洞,如果广告网络运营者能够在页面中嵌入一个透明的iframe,就可以植入cookies。这项由斯坦福大学的毕业生Jonathan Mayer做出的发现一度引起了广泛关注。另一种方法,是去采集浏览器本身披露的信息,为该设备建立一份“指纹档案”。结合浏览器的使用程度、是否支持Javascript等所获信息程度不同,最乐观能达到94%的准确度。
“还有一种方法,是结合存活期较长的单一域标识信息(长期标识),并借助一个临时的跨域标识符来帮助广告网络达成所需目的。这个长期标识和第一方cookie关联(一对一映射),会在请求广告时作为一种UID信息传递给广告网络。在一次访问周期内,我们可以使用一些在用户访问期间能够保持不变的信息作为临时踏板,例如IP地址,或者通过移动运营商的WAP网关(所有的浏览器会话都会通过WAP网关进行传输)传递的标识符。这样多个网站可以在一个visit周期内被关联起来,被记录为是这个访问者浏览过的网站。而在下一次访问周期内,访问者的IP地址或者WAP网关可能跟第一次访问时不一样了,我们该如何把下一次访问跟前一次访问关联起来归到这一个访问者(而不是两个访问者)呢?为了能够辨别这仍然是前一次的某个访问者,我们观察新一次访问到的所有网站中记录的第一方cookie有没有跟之前的访问网站记录相匹配的。在下图的例子中,正好有这样的情况。这个访问者在第一次访问中访问了Publisher 1、2、3;而第二次访问中访问了Publisher 1、5、19。由于每个网站都有第一方cookie,而两次访问又正好都访问了Publisher 1,因此可以通过publisher 1的第一方cookie知道两次访问是同一个访问者又回来了。并且我们也就可以知道,Publisher 1、2、3、5和9都是这一个访问者浏览的。根据运营商的不同以及运营商和广告商的关系,这个网关识别符存活期可长可短,理想情况下这个标识符可能永远不变。不过显然,这项技术只对于用户常常访问的网站才有效,而且广告网络也基本没办法实时使用这些信息。这种方法可以和数字指纹结合使用,能够提高指纹的准确性或减少生成指纹所需的计算次数。下图对上述方法进行了示例:
“不过,如果正好有访问者玩儿了App,又过了会儿上了网(通过手机浏览器),那么该如何辨识他们是同一个人呢?
“如上文所述,移动网站和APP分属不同的域,也各自使用着不同的标识符。从广告商的角度来看,这意味着用着同一台设备的同一个人,却被分离成了两个。从用户的角度来看,这不忠实于用户所选的拒绝追踪设置(包括监测和行为分析),明明在一个域下进行过追踪设置(例如在浏览器中停用了Cookie或设置了禁止追踪),在另一个域下却未被识别,因为广告网络也分辨不出来这是之前设置过拒绝追踪的那个人。而且App和网站页面之间为什么常常会跳来跳去,这也让人难以理解。
“将App和移动网站关联起来的最常见方法,通常是在用户点击一个App内的广告时生效的。用户点击的这个广告时指向目的地的URL对于该用户而言是唯一的,它带有一个能够映射到App域下用户标识符的URL后面的参数,而这个URL和参数,对于同一个设备上浏览网页时的相同广告主的广告,也是一样。即无论在App上做广告,还是在web上做广告,广告的URL后面的参数都必须一样,且这个URL用来标识这个用户。当用户转跳到了广告主的网站上,广告网络就能通过URL尾参中的标识符将App域下的标识符和网站的关联到一起。广告网络也会通过各种技术进行反向定位(举一个重要的使用场景:当用户在网站上看到一个关于新App的广告,例如最新、最酷的游戏,广告网络想要知道这个用户是否最终动心点击广告并且真正完成了下载。)不过,这些技术的应用前提是广告网络能够访问两种不同域下共有的存储信息,各操作系统对此的门槛也高低不同。”
我的评注:
这个文章所描述的,是目前移动营销数据监测的一个缩影。移动终端比PC先天好的地方在于,有类似UDID或者IMEI这样的永久性标识来锁定一个设备,这使我们对于unique类数据(例如unique impression,unique click,unique visitor等)的追踪显得更加容易。但这些永久性标识却存在较大的隐私争议,而造成应用范围的不断萎缩。但如果没有这些永久标识,追踪unique类数据就比PC更麻烦了。这种情况下我们仍然不得不求助于cookie,第一方的和第三方的(事实上mobile cookie和web cookie实现方法是不同的,但它们的作用几乎一样,所以也被开发者沿用了cookie的名称),即使是在App中,我们也用曲线救国的方法装入cookie。
但cookie也遇到了问题,除了仍然让人心烦意乱的隐私问题,另一个麻烦是在用户体验上的,iOS系统下,可能会造成用户在点击进入App时,突然被踢出App,打开一个浏览器,然后又被踹回App的体验。Apple也在开始禁止开发者使用cookie追踪技术。
上面的原理全部集中在如何进行用户辨识和跨域(以及跨界,即跨web和app)上,那么如何辨识web上或是App上用户的具体行为呢?
从mobile web的角度看,与PC上的web的用户行为追踪原理没有太大的不同,同样需要依赖于cookie,或至少得用pixel tracking的方法(关于什么是pixel tracking,我正在写的书中间会详细说明)。而App内用户行为的追踪最常用的方法是通过SDK(软件开发工具包)在App内放置监测程序的头文件、库和其他模块,同时对你感兴趣的用户交互行为单独加上代码进行追踪,这颇像我们后面小节中要讲到的event tracking(事件追踪)的方法。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11