大数据和云计算有什么关系-CDA数据分析师官网

热线电话：13121318867

大数据和云计算有什么关系

2018-07-22

大数据和云计算有什么关系

长期以来，传统企业信息化系统采用关系数据库来存储数据，其中规模较大的通常被称为“数据集市”。随着采集数据的种类越来越多，部分行业领先公司把不同数据集市集中到一个大系统，形成企业级数据仓库，由专门的数据团队管理和维护。但随着数据量的惊人增长，传统数据库无法支撑起新的存储需求了，分布式数据存储系统和分布式文件系统被发明出来并得以广泛应用。这些技术也为大数据的运用铺平道路。大数据时代，云计算的出现大大降低了大数据应用门槛。

云计算是什么?一般说来，它是基于互联网的相关服务的增加、使用和交付模式，通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云计算是一种按使用量付费的IT服务模式，这种模式提供可用的、便捷的、按需的网络访问，进入可配置的计算资源共享池（资源包括网络，服务器，存储，应用软件，服务），这些资源能够被快速提供，只需投入很少的管理工作，或与服务供应商进行很少的交互。那么云计算的定义中有一个最重要的关键词：按需。云计算提供商是根据用户需求，按需提供计算资源的，另外就是云计算架构具有很大的弹性，和扩展性，因为所有的实际物理资源都被虚拟化（抽象化），可配置和可管理。

云计算技术包括分布式文件系统、分布式计算、分布式数据存储等。基于云计算架构，可以实现高并发处理系统来处理海量请求，也可以搭建存储海量数据的云存储系统，也可以搭建分布式计算系统来对数据进行挖掘。生活化一点，包括我们所熟知的搜索引擎、网络视频、电子商务、电子邮件、地图导航等都属于云计算的范畴。

大数据是什么？在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中提出：大数据指不用随机分析法（抽样调查）这样捷径，而采用所有数据进行分析处理。

那么究竟多大的数据算是大数据，这个其实并没有明确的定义。不过IBM提出了大数据的5V特点：Volume（大量）、Velocity（高速）、Variety（多样）、Value（低价值密度）、Veracity（真实性）。这也是目前大家比较公认的大数据的特征。

这个5V的特点，反映了大数据数据量大、产生的速度快且多样，同时大数据具有低价值密度的特点，同时大数据也可能会夹杂一些干扰，影响数据的真实性。因此需要一些技术手段能够快速处理海量数据，并且能够从大数据中挖掘有价值的信息。

大数据从何而来？

移动互联网的大数据主要来自四个方面：

（1）内容数据。Web2.0时代以后，每个人都成为了媒体，都在网络上生产内容，包括文字、图片、视频等等。

（2）电商数据。随着电子商务的发展，线上交易量已经占据整个零售业交易的大部分。每一笔交易都包含了买家、卖家以及商品背后的整条价值链条的信息。

（3）社交数据。随着移动社交成为最主要的社交方式，社交不仅仅只有人与人之间的交流作用，社交数据中包括了人的喜好、生活轨迹、消费能力、价值取向等各种重要的用户画像信息。

（4）物联网数据。各行各业都出现了物联网的需求和解决方案，每时每刻都在产生巨量的监测数据。

那么如此之多的数据，包含着很多有价值的信息，这些信息并不是以直观的形式呈现出来的，需要有办法对这些数据进行处理，无论是计算、存储还是通信，都提出了很高的要求，云计算的相关技术就是对巨量数据的计算、存储和通信的解决方案。

但有一点不变的是，不管云计算怎样去变化，必然需要依托数据中心实现落地。可以说，数据中心是云计算的根，云计算是数据中心“叶子”，云计算通过“光合作用”促进数据中心的发展，而数据中心得壮大又为云计算发展提供了坚实的基础。两者起到相互依存，互相促进的作用。