在前不久举办的CDAS2016中国数据分析师行业峰会·互联网大数据分论坛,网易商业智能部门总监沈琦分享了网易云音乐如何依靠数据治理,实现从0到2亿用户的增长。下文根据嘉宾演讲实录整理。
大家下午好。非常幸运今天下午能到这里给大家分享。
在模型上的宽表问题上做几个建议。不具有统计意义的字段不要放到宽表。比如歌词,量很大,但这个东西没有统计意义。宽表是存起来经常被访问和扫描的,不要放经常变化的维度。宽表可能是一年的宽表,如果经常变的话,每更新一次都要一天了。太大字段也不要放进去,宽表受不了这么大字段的扫描。
对数据挖掘建模感兴趣的同学,CDA开设数据挖掘课程,四大专题,皆为大牛,R语言近期开课,预报从速:
数据分析咨询请扫描二维码