标签命名方式有什么参考规则?
为了便于对诸多标签进行集中管理,需要对每个标签对应的标签 id 进 行 命 名 。 例 如 , 对 性 别 为 “ 男 ” 的 用 户 打 上 标 签 “ATTRITUBE_U_01_001” , 性 别 为 “ 女 ” 的 用 户 打 上 标 签“ATTRITUBE_U_01_002”。
下面我们详细介绍如何建立起这套标签命名方式。 对于一个标签,可以从标签主题、刻画维度、标签类型、一级归 类等多角度入手来确定每个标签的唯一名称,如图2-5所示。
·标签主题:用于刻画属于哪种类型的标签,如人口属性、行为属 性、用户消费、风险控制等多种类型,可分别用ATTRITUBE、 ACTION、CONSUME、RISKMANAGE等单词表示各标签主题。
·用户维度:用于刻画该标签是打在用户唯一标识(userid)上, 还是打在用户使用设备(cookieid)上。可用U、C等字母分别标识 userid和cookieid维度。
·标签类型:类型可划分为统计型、规则型和算法型。其中统计型开发可直接从数据仓库中各主题表建模加工而成,规则型需要结合公司业务和数据情况,算法型开发需要对数据做机器学习的算法处理得到相应的标签。
·一级维度:在每个标签主题大类下面,进一步细分维度来刻画用 户。
参照上面的命名维度和命名方式,下面通过几个例子来讲述如何 命名标签。
对于用户的性别标签,标签主题是人口属性,用户维度为 userid , 标 签 类 型 属 于 算 法 型 。 给 男 性 用 户 打 上 标 签 “ATTRITUBE_U_01_001” , 给 女 性 用 户 打 上 标 签 “ATTRITUBE_U_01_002” , 其 中 “ATTRITUBE” 为 人 口 属 性 主 题,“_”后面的”U”为userid维度,“_”后面“01”为一级归类,最后面 的“001”和“002”为该一级标签下的标签明细,如果是划分高中低活 跃用户的,对应一级标签下的明细可划分为“001”“002”“003”。
标签统一命名后,维护一张码表记录标签id名称、标签含义及标签口径等主要信息,后期方便元数据的维护和管理。以上介绍的标签命名方式可作为开发标签过程中的一种参考方式。








暂无数据