185****1226

2020-06-14   阅读量: 875

高效使用Power BI的15条建议

扫码加入数据分析学习群

01 过滤源数据


仅从数据源导入需要的数据表,而避免导入与分析无关的数据。

比如你只是分析销售情况,把订单表和相应的维度表导入进来就可以了,没有必要把人事、物流等各种数据也导进来。

即使是导入订单表,也仅导入分析所需的行,如果你要分析的是过去三年的情况,就不要试图导入所有的历史记录。


02 删除无关列


删除与分析无关的列,可以显著的降低内存占用。

比如从CRM系统提取过来的订单表,可能有几十列,而分析需要的可能只是某几列,那么其他的数据列要果断的删除。


03 聚合分析粒度


数据源中的表经常是最细颗粒度的数据,及时聚合到分析的维度是必要的。

比如订单表, 订单时间可能精确到某一天的几点几分几秒,而要分析的粒度可能是月份、季度和年份,那么尽早将数据聚合到分析的粒度,就可以显著的降低数据的行数。


04 整理字段


数据导入进来以后,一般情况下我们只是看看数据类型是否正确,而不做更细的整理,其实以下的操作可以减少内存的占用:

舍入数字以删除多余的小数位;

将日期中不用的分秒数据舍去;

将日期时间型数据拆分为日期列和时间列;

将可拆分的一个文本列,拆分为两列,比如某一列的数据是省份+城市,将其拆分为省份列和城市列。


05 禁用不必要的加载


对于最终模型中不需要的表,禁用加载至关重要。

从数据源将导入数据到PowerQuery编辑器之后,我们一般会进行各种转换,比如将多个表合并到一个表中,或许最终我们使用的是合并表。但在默认情况下,点击"上载"之后,PQ中的所有表都会加载到Power BI模型的内存中。

06 禁用系统日期表


禁用内置的日期表,可以提升PowerBI的运行速度。

PowerBI 会自动为模型中的每个日期字段创建内置日期表,以支持时间智能函数。这些表是隐藏的,它们消耗内存,因此及时打开选项,去掉“自动日期/时间”的勾选,

07 选择适当的数据类型


确保所有列都具有正确、精准的数据类型,我们往往更关注类型是否正确,而不太关注类型是否精准。

比如:我们一般更关注是文本型还是数值型,而对于数值型,其实还可细分为整数型和小数型,他们两个都是数值型,不会影响运算结果,但会影响运算效率,尽量直接修改为最合
适的数据类型,可以用整数型就不要用小数,能用定点小数就不要用浮点小数。


08 选择合适的连接方式


Power BI主要有两种连接模式:import和DirectQuery,对于一般的数据源,应尽可能使用import方式将数据导入到PowerBI,Import利用Power BI的高性能查询引擎,为你提供高度互动和全功能的体验。

但是,如果通过import无法满足你的目标,请考虑使用DirectQuery。 

09 避免使用计算列


从Excel带过来的“坏习惯“之一就是更偏好使用计算列,它的结果可以直观看到,但计算列带有隐藏成本,它更消耗内存,会增加数据刷新时间。

一种更有效的方法是使用度量替换计算列,度量值不占用内存,只有在上下文中才进行计算,所以尽早养成使用度量值的好习惯!


10  不断优化DAX


刚开始学习时,对DAX的要求很低,只要能正确的计算出结果就行,但随着学习的深入,你还应了解一些函数的计算原理,不断寻找更好的函数和更快的代码。

比如:SUMMARIZECOLUMNS函数的性能明显优于ADDCOLUMNS+SUMMARIZE组合;使用VAR定义变量的方式处理速度会更快等。

解决同一个问题,会有不同的方案,识别并选择最优的那一个!


11  尽量使用默认可视化对象


能用默认的图表就不要使用自定义图表,能用简单的图表进行表达的,就不要使用高度复杂的可视化。

比如能用简单柱形图就可以清晰展现的,就没有必要使用地图。


12  避免直接展示明细数据


如果你的某个维度有数万个数据点,如果你打算在画布上使用表格或者图表全部展示出来,可能需要几秒甚至几分钟才能刷新出来,这种体验是不可接受的。

最佳做法是,只展示重点关注的信息,比如该维度的前20名,可以利用筛选器,轻松筛选出需要的数据,并提升计算性能。


13  避免过度使用交互


在PowerBI中可以创建丰富的交互式报表,功能强大、操作简单,可同时在多个图表,甚至多个页面实现动态联动。

但每次的交互联动,都会触发多个查询,很可能会拖慢数据刷新速度,最佳做法是仅为相关的报表设置动态响应,移除无关的报表筛选,避免不必要的同步切片器等。


14  简化设计


很多人可能都是被PowerBI炫酷的可视化吸引过来学习的,所以初学者常犯的错误是创建过于“复杂”的报表。

比如单页放置过多的图表、图表中显示详细数据、无节制的使用控件等,最终生成看起来花哨但运行缓慢且低效的报表或仪表板。

使用PowerBI与万事万物一样,物极必反,过犹不及。不要试图把你想表达的内容都放到一个大而全的报表中,你应该引导用户逐步深入探索更细粒度的数据,而不是一次全部展示出来。

简化设计,少即是多。



15  定期更新PowerBI Desktop


PowerBI在迅速迭代,不断提升性能,可能你没有作任何改变,仅仅是升级到最新版,就可以大大提升运行速度。

所以一定要养成定期更新的好习惯(win10系统可以自动更新),并且,如果你的电脑是64位的系统,就不要安装32位的软件。

0.6244 6 2 关注作者 收藏

评论(0)


暂无数据

推荐课程