数据的不一致性一般是由于不同的数据源导致。如有些数据源的数据单位是斤,而有些数据源的数据单位为公斤;如有些数据源的数据单位是米,而有些数据源的数据单位为厘米;如两个数据源的数据没有同时更新等。对于这种不一致性可以通过数据变换轻松得到一致的数据,只有数据源的数据一致了,才可以进行统计分析或数据挖掘。由于这类问题的处理比较简单,这里就不累述具体的处理办法了。
来源 | 先锋的家园(51CTO博客)
http://jackwxh.blog.51cto.com/2850597/1742916
数据分析咨询请扫描二维码