大数据VS小数据：9种数据类型及利用方法-CDA数据分析师官网

热线电话：13121318867

大数据VS小数据：9种数据类型及利用方法

2015-10-12

大数据VS小数据：9种数据类型及利用方法

如今，具有压倒性的数据量使得市场营销人员和广告商们已经难以理解哪些信息非常重要，哪些信息是纯粹的噪音，哪些数据是正确的？而哪些数据又是可以信赖的？不同类型的数据具有什么作用，又应该如何被使用？下面笔者根据专注以数据为基础的多渠道营销自动化智能化机构webpower的数据客观可信度排名，给大家介绍9种不同类型的数据，以及它们应该如何被有效使用。

1.试验性数据

通过客观的专业第三方精心设计和严格控制的试验，得到最可靠的数据。并且全程和专业熟练的分析人员一起，对数据中的噪声进行了分离。

2.调查研究数据

由经验丰富的专业第三方专业人士做科学研究，产生的可靠数据。研究设计，规范的数据，数学建模，刺激控制，统计控制，历史经验，质量保证标准等使得数据往往非常精确，噪声往往最小。

3.营销组合模型数据

创造一个分析数据库，并清理和规范这些数据，采用多元统计和建模去隔离和消除部分噪音，以使营销组合模型数据比实际销售数据更好。营销组合建模数据中的信号更稳定，更可靠，更加可测量。这种类型的数据可以帮助企业了解哪些变量推动了他们业务，如是媒体广告，或者销售人员的数量，或定价差异？但通常需要多年的数据积累来从营销混合建模中获得最大价值。

4.媒体组合建模数据

这和营销组合建模是相同的概念，规则相同，只是应用了一组不同的变量。一个分析数据库，数据清洗，建模和使数据中噪声被最小化，从而使各种媒体的影响被分离开来。同样，如果再与控制实验结合，那么这些数据和分析将更具有解释说明性。

5.销售数据

webpower认为销售数据一定程度上可以被信任，但以销售数据衡量实际销售效果并不完美。因为销售可能还受广告效果、最佳媒体花费、产品质量、服务效率、有竞争力活动等等影响。经济，竞争活动，天气，通货膨胀，度假周期，新闻事件，政治事件，库存和分销偏差，定价紊乱等因素也制造了错误的反馈和歪曲的景象，所以销售数据并不是衡量原因和效果的最好方法，而只是理智的衡量什么已经发生，它并不会告知为什么发生以及什么使之发生。

6.眼球追踪数据

眼球追踪主要是研究眼球运动信息的获取、建模和模拟。而获取眼球运动信息的设备除了红外设备之外，还可以是图像采集设备，甚至一般电脑或手机上的摄像头，其在软件的支持下也可以实现眼球跟踪。随着测量设备和软件的稳步改善，您可以利用眼球追踪技术获取及生成有用的诊断信息，以帮助理解为什么一个项目、网站或广告没有成功引起用户注意或注册某些消息或图像。

7.生物识别或生理测量

皮肤电反应，眼睛的瞳孔扩张，心脏率，脑电图（脑电波）测量，面部情绪识别等都非常有趣和令人兴奋，他们都可能将来成为进入人的灵魂的门户，但目前，这些措施在很大程度上是推测性的和未经证实的。其中一些措施在跟踪人的意识觉醒上相当不错，但如果没有引入测量或定性研究，就没有精确的方法去知道这个觉醒是否积极或者消极。

8.群体或咨询小组数据

许多大公司都购买了一些能够使其经常对一小组目标客户进行调研及对话的系统。企业的各类人群每天或每周都在持续地进行这种小众的调查。如果不把结果的质量考在内，每次调查或测量的成本相对比较低。但是由于这样的群体并不真正具有代表性，也不是随机选择的，且很少验证过，所以随着时间的推移，条件反射和惯性学习的风险将破坏群体的代表意义。

9.社会化媒体数据

社交媒体数据非常受欢迎。因为该数据往往比较便宜的，数量大，并且实时（每天或每时）。许多新的软件工具和系统也比较容易对数据进行分析。社交媒体数据也许作为早期预警系统最有价值，但是，必须始终以怀疑和质疑的态度去对外社交媒体数据，webpower认为有以下几个原因：

1）许多产品类别和品牌几乎从来没有在社会化媒体上被提及，使得样本量太小，数据的可靠性无法确定。

2）社交媒体评论受复杂因素影响，如新闻，特别活动，媒体广告，促销，宣传，电影，竞争活动和电视节目等，因此数据中的噪音很多。

3）社交媒体数据受到操作。你可能会认为你正在跟随一个重要的数据趋势，后来才得知这只是竞争对手混淆你的一个聪明的计谋。越来越多的企业和其他组织都在努力创造社会媒体内容和管理社会化媒体评论，因此数据的研究价值也正在迅速减少。

社交媒体评论是通过网页抓取识别和收集的，我们几乎从来不知道确切的来源，背景，刺激因素，或评论背后的历史。这些未知因素使得诠释社交媒体数据变得危险。这就是为什么我们要以畏惧的精神和充满怀疑的眼光去审视社交媒体数据。

小数据

笔者曾经也说过，在目前阶段，如果企业决策者能够依靠一些小数据工具和系统，而不是大数据的设想，数据将能够更好地服务于你的企业。抽样理论告诉我们，如果样本是随机的，企业可以通过与很少量的人群进行交谈，以测量整个目标群体的行为或心理。

一个包含1500的样本足以预测谁将会赢得总统选举。200-300受访者的样本通常足以预知整个人口喜欢一个新的产品或服务的程度。对一个包含200个用户的样本进行一个新的家用花生酱测试，可以精确地确定该产品是否是最优，一旦推出之后占有的市场份额。

这些都是小数据的例子。调查研究是相对便宜，但非常准确，因为专业研究人员知道来源，刺激因素，背景和历史，并具有可靠的测量仪器，数据规范，质量保证和控制。尽管大家都在谈论及憧憬大数据，但小数据往往为企业决策提供了更完善、更准确的依据。少量（小）数据又应如何正确地被分析被理解，以获得更高的成本效益，提供更好的营销洞察力，在以数据为基础的多渠道营销自动化智能化机构。