CDA持证人阿涛哥
2023-02-02 阅读量: 301
分区存储
如果将用户标签开发成一张大的宽表,在这张宽表下放几十种类 型标签,那么每天该画像宽表的ETL作业将会花费很长时间,而且不便 于向这张宽表中新增标签类型。
要解决这种ETL花费时间较长的问题,可以从以下几个方面着手:
·将数据分区存储,分别执行作业;
·标签脚本性能调优;
·基于一些标签共同的数据来源开发中间表。
下面介绍一种用户标签分表、分区存储的解决方案。
根据标签指标体系的人口属性、行为属性、用户消费、风险控 制、社交属性等维度分别建立对应的标签表进行分表存储对应的标签 数据。
CDA学习 免费安装激活office2021的office tool plus工具链接:https://pan.baidu.com/s/1v9Atqb8c9UiiJ2dTN33icw?pwd=o48z 提取码:o48z
CDA学习-4.2.4 描述性统计图表在完成以上数据描述性统计分析之后,需要对数据进行解释,借用一些简单的统计表和统计图能辅助解释,接下来介绍一些常用的描述性统计分析的统计表和统计图。整理数据的重要工具——统计表在数据分析中,常用到的统计表是频数分布表,其将杂乱无章的数据按照取值情况进行分组整理,并计算相关指标,从中可以初步看出数据的分布情况。频数分布表常在表的第一列列出类别或组别,第二列统计各类
excel透视表如何显示各类别的各自求和金额方法: 设计-分类汇总-在组的顶部显示所有分类汇总
一表 学生表学生ID 学生姓名 学生年龄S01 张三 20S02 李四 22S03 王五 25多表 成绩表学生ID 学生科目 学生成绩S01 C01 60S01 C02 70S01 C03 80S02 C01 50S02 C02