dreamhappy2012

2018-11-26   阅读量: 781

大数据对传统小数据分析的拓展及其区别和联系

扫码加入数据分析学习群

l 数据上:小数据重抽样,大数据重全体。由于传统小数据分析的本质是基于样本推断总体,因此在分析过程中十分注重抽样的科学性。只有抽样是科学的,其推断结果才具有科学意义。而大数据虽然不一定是总体,但由于在建模方法上已经更偏向于机器学习,因此抽样已经不是必要的手段和方法论了。

l 方法上:小数据重实证,大数据重优化。传统的小数据在方法上更重视实证研究,强调在相关理论的前提下建立假设,收集数据,建立模型并验证假设。而大数据往往更重视方法论中的自我迭代和自我优化过程,可能运算的第一个结果与标准答案相差甚远,但是可以通过与正确答案的不断校准(往往建立损失函数),使得模型的精度不断提高。

l 目标上:小数据重解释,大数据重预测。小数据的分析往往注重归因分析,探索变量之间的内部影响机理,例如究竟什么样的生活习惯会提高癌症的发病率。但是大数据往往关心的是对于未知对象的预测,例如判别某个人是否患有癌症,或者患有癌症的概率是多少。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 3 关注作者 收藏

评论(0)


暂无数据

推荐课程