大数据是怎么产生的它的商业机会在哪-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读大数据是怎么产生的它的商业机会在哪

大数据是怎么产生的它的商业机会在哪

2015-09-30

大数据是怎么产生的它的商业机会在哪

近些年，大数据已经和云计算一样，成为时代的话题。大数据是怎么产生的，商业机会在哪？研究机会在哪？这个概念孕育着一个怎样的未来？

昨天在车库咖啡参加了一个小型的研讨活动，就这些问题进行了一些讨论，我结合自己的一些理解做一个总结。

首先，大数据是怎么产生的？

1）物理世界的信息大量数字化产生的

例如刘江老师指出的好大夫网，将医生的信息，门诊的信息等数字化。其实还有很多，比如新浪微博将茶馆聊天的行为（弱关系产生信息数字化），朋友聊天的行为数字化（强关系产生信息数字化）。视频监控探头将图像数字化。

2）社交网络产生的

在雅虎时代，大量的都是读操作，只有雅虎的编辑做一些写操作的工作。进入web2.0时代，用户数大量增加，用户主动提交了自己的行为。进入了社交时代，移动时代。大量移动终端设备的出现，用户不仅主动提交自己的行为，还和自己的社交圈进行了实时的互动，因此数据大量的产生出来，并且具有了极其强烈的传播性。

3）数据都要保存所产生的

一位嘉宾指出，旧金山大桥保留了百年的历史数据，在时间跨度上产生了价值，很多网站在早期对数据的重视程度不够，保存数据的代价很大，存储设备的价格昂贵，但是时代变了，存储设备便宜了，用户自己产生的数据得到了重视，数据的价值被重视了。因此越来越多的数据被持续保存

其次，大数据和大规模数据的区别？

big data之前学术界叫very large data，大数据和大规模数据的差距是什么？我认为在英文中large的含义只是体积上的，而big的含义还包含重量上的，价值量上的。因此我认为

1）大数据首先不是数量上的堆砌，而是具有很强的关联性结构性

比如有一种数据，记录了世界上每一颗大树每年长高的程度，这样的数据不具有价值，因为只是简单堆砌。

如果数据变成，每一个大树记录它的，地点，气候条件，树种，树龄，周边动植物生态，每年长高的高度，那么这个数据就具有了结构性。具有结构性的数据首先具有极强的研究价值，其次极强的商业价值。

在比如，淘宝的数据，如果只记录一个交易的买家，卖家，成交物品，价格等信息，那么这个商业价值就很有限。淘宝包含了，买家间的社交关系，购物前后的其他行为，那么这个数据将非常有价值。

因此，只有立体的，结构性强的数据，才能叫大数据，才有价值，否则只能叫大规模数据。

2）大数据的规模一定要大，而且比大规模数据的规模还要大

要做一些预测模型需要很多数据，训练语料，如果数据不够大，很多挖掘工作很难做，比如点击率预测。最直白的例子，如果你能知道一个用户的长期行踪数据，上网的行为，读操作和写操作。那么几乎可以对这个人进行非常精准的预测，各种推荐的工作都能做到很精准。

最后，大数据的机会在哪里？对小公司的机会在哪？

围绕数据的整个产业链上，我认为具有以下机会

1）数据的获得

大量数据的获得，这个机会基本属于新浪微博等这类大企业，大量交易数据的获得，也基本属于京东，淘宝这类企业。小企业基本没机会独立得到这些用户数据。

2）数据的汇集

例如如果你要能把各大厂商，各大微博，政府各个部门的数据汇集全，这个机会将是极大的。

但，这个工作，做大了需要政府行为，做中档了，要企业间合作，做小了，也许就是一个联盟或者一个民间组织，比如中国爬盟。

3）数据的存储

汇集了数据后，立即遇到的问题就是存储，这个代价极大，原始数据不能删除，需要保留。因此提供存储设备的公司，执行存储这个角色的公司，都具有巨大的市场机会，但是这也不属于小公司，或者早期创业者。

4）数据的运算

在存储了数据以后，怎么把数据分发是个大问题，各种API，各种开放平台，都是将这些数据发射出去，提供后续的挖掘和分析工作，这个也需要有大资本投入，也不适合小公司。

5）数据的挖掘和分析

数据需要做增值服务，否则数据就没有价值，big也big不到哪里去，是没有价值的big。因此这种数据分析和挖掘工作具有巨大的价值，这个机会属于小公司，小团体。

6）数据的使用和消费

在数据做到了很好的挖掘和分析后，需要把这些结果应用在一个具体的场合上，来获得回报，做数据挖掘和分析的公司，必须得找到这些金主才行，而这些金主肯定也不是小公司。

大数据未来的形态，或者产业链结构一定是分层的，巨大的，价值的体现发生在各个层次，每个层次都是生态链的重要一环，都孕育着巨大的机遇和挑战，我们能做的唯有努力，做适合自己的工作。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

大数据云计算数据挖掘数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

大数据是怎么产生的它的商业机会在哪

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：曾津谈互联网数据分析与业务赋能实 ...

【CDA干货】Pandas文本词频统计：查找关键词出现次 ...

从“数据存储”到“智能取数”：CDA数据分析师视角 ...

【CDA干货】CDA透视分析核心计算方法：求和、计数、 ...

【CDA干货】客户交易价值分析：核心逻辑、分析方法 ...

从“数据仓库”到“智能取数”：CDA数据分析师视角 ...

CDA持证人专访：黄冬谈数字化运营核心与数据中台建 ...

【CDA干货】市场调查、竞品分析、需求调研的核心区 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】MySQL分表如何查询数据在哪张表？实战方 ...

【CAD干货】业务模型与逻辑模型的概念辨析及实战案 ...

从“零件”到“引擎”：CDA数据分析师视角下的指标 ...

CDA持证人专访：宋利宝谈电销行业数据运营与数据分 ...

【CDA干货】ARIMA时间序列分析方法：核心原理、建模 ...

从“通用基石”到“场景利器”：CDA数据分析师视角 ...

【CDA干货】SQL Server 提示“实例已在使用”：常见 ...

【CDA干货】Excel数据透视表两列相乘：正确计算方法 ...

从“模糊需求”到“精确标尺”：CDA数据分析师视角 ...

CDA持证人专访：冯卓基谈大数据平台搭建与行业数字 ...

【CDA干货】基于月度数据的送货率提升专项数据分析 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

大数据是怎么产生的 它的商业机会在哪

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：曾津谈互联网数据分析与业务赋能实 ...

【CDA干货】Pandas文本词频统计：查找关键词出现次 ...

从“数据存储”到“智能取数”：CDA数据分析师视角 ...

【CDA干货】CDA透视分析核心计算方法：求和、计数、 ...

【CDA干货】客户交易价值分析：核心逻辑、分析方法 ...

从“数据仓库”到“智能取数”：CDA数据分析师视角 ...

CDA持证人专访：黄冬谈数字化运营核心与数据中台建 ...

【CDA干货】市场调查、竞品分析、需求调研的核心区 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】MySQL分表如何查询数据在哪张表？实战方 ...

【CAD干货】业务模型与逻辑模型的概念辨析及实战案 ...

从“零件”到“引擎”：CDA数据分析师视角下的指标 ...

CDA持证人专访：宋利宝谈电销行业数据运营与数据分 ...

【CDA干货】ARIMA时间序列分析方法：核心原理、建模 ...

从“通用基石”到“场景利器”：CDA数据分析师视角 ...

【CDA干货】SQL Server 提示“实例已在使用”：常见 ...

【CDA干货】Excel数据透视表两列相乘：正确计算方法 ...

从“模糊需求”到“精确标尺”：CDA数据分析师视角 ...

CDA持证人专访：冯卓基谈大数据平台搭建与行业数字 ...

【CDA干货】基于月度数据的送货率提升专项数据分析 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

大数据是怎么产生的它的商业机会在哪