登录
首页精彩阅读大数据时代(一)--是什么,然不是为什么
大数据时代(一)--是什么,然不是为什么
2017-08-08
收藏

大数据时代(一)--是什么,然不是为什么

在小数据时代,相关关系分析和因果分析都不容易,都耗费巨大,都要从建立假设开始。然后我们会进行试验--这个假设要么被证实要么被推翻。但由于两者都始于假设,这些分析就都有受偏见影响的可能,而且极易导致错误。与此同时,用来做相关关系分析的数据很难得到,收集这些数据时也耗资巨大。现今,可用的数据如此之多,也就不存在你这些难题了。

当然,还有一种的情况也逐渐受到了人们的重视。在小数据时代,由于计算机能力的不足,大部分相关关系分析仅限于寻求线性关系。这个情况随着数据的增加肯定会发生改变。事实上,实际情况远比我们所想象的要复杂。经过复杂的分析,我们能够发现数据的“非线性关系”。
首先,我们的直接愿望就是了解因果关系。即使无因果联系存在,我们也还是会假定其存在。看看下面的三句话:“弗雷德的父母迟到了;供应商快到了;弗雷德生气了。”我们读到这里,可能立马就会想到弗雷德生气并不是因为供应商快到了,而是他父母迟到了的缘故。实际上,我们也不知道到底是什么情况。即便如此,我们还是不禁人为这些假设的因果关系是成立的。
亚马逊曾经的书评组,评论家所创造的销售业绩与推荐系统对比测试,两者之间业绩相差甚远。计算机可能不知道为什么喜欢海明威作品的客户会购买菲茨杰拉德的书,但是这似乎并不重要,重要的是销量。


数据分析咨询请扫描二维码

客服在线
立即咨询