【结构化数据及高级编辑查询】
1、结构化数据—列表List{ }
说明:列表有序号可检索,序号从0开始,书写格式:{123,true,"A"}
2、结构化数据—记录Record[ ]
说明:字段名+字段值,字段名可不用引号,也可以#加"",书写格式:
3、结构化数据—表Table( )
说明:用#table建表,定义列名可用列表或记录,隐式或显示方式定义字段的数据类型。书写格式:
4、应用一
用高级编辑器语言编写如下所示的表格结构和记录。
5、应用二
编写获取网站数据的查询,从空气知音网站爬取各省市的空气质量数据。网址格式:http://www.air-level.com/air/+城市名拼音,城市名为文本变量。
【Power Pivot 搭建多维数据模型】
1、表的对应关系
一对一:主键对主键,在业务工作中几乎见不到
多对多:非主键对非主键,可以遇到但是不能使用,因为能连接但没法正确进行分类汇总
一对多:主键对非主键,连接时应该使用的连接关系,多表出度量(连续型变量),一表出维度
注:维度筛选度量,筛选是维度汇总度量的能力。
2、变量类型(数据类型)......是否为主键:
名义型(文本),如ID、姓名、星座、血型等,用于维度,可为主键
有序型(文本):成绩水平、员工绩效、健康状况,用于维度,不能为主键
连续型(数值):温度、身高、体重,用于度量,不能为主键
3、多维数据集间的关系
表间关系永远是一表指向多表,一表出维度+多表出度量确定透视表的结构。
下图是Power Pivot中建立表关系的ER图,其中1是一表,箭头永远指向多表,表与表之间可以建立单向、双向连接。
4、建立数据模型的逻辑——交叉筛选器和链接规则
单向连接下:一表出维度多表出度量(T1)
双向连接下:一表出维度多表出度量(T1),多表出度量一表出维度(T2)
- T1连接关系:维度对度量的合并同类项计算
- T2连接关系:维度下对应连接用关键字不同情况对度量的合并同类项
5、T2链接关系可能出现的场景:
(1) 如下图,相邻的两表双向连接时,多表出维度,一表出度量,这种情况要避免。
(2) 如下图,跨表筛选——通过关键字进行跨表连接,要尽量避免;当满足维度与关键字是父子级关系的时候,T2才会和T1得到相同结果。
注:一个父级值对应多个子级值,一个子级值只能属于一个父级值,如省份与城市、产品系列和产品。





