
以云计算为依托的大数据该走向何方
云计算和大数据的定义
大数据(big data),是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。对于“大数据”(Big data)研究机构 Gartner 给出了这样的定义。“大数据”是需要新处理模式才能具有更强的 决策力 、 洞察 发现力和流程优化能力的海量、高增长率和多样化的信息 资产 。
云计算 (cloud computing)是基于 互联网 的相关服务的增加、使用和交付模式,通常涉及通过 互联网 来提供动态易扩展且经常是 虚拟化 的资源。云是 网络 、 互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示 互联网 和底层基础设施的抽象。因此,云计算甚至可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟核爆炸、 预测 气候变化和市场发展趋势。用户通过 电脑、 笔记本 、手机等方式接入数据中心,按自己的需求进行运算。
对云计算的定义有多种说法。对于到底什么是云计算,至少可以找到100种解释。现阶段广为接受的是美国国家标准与技术研究院( NIST )定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括 网络 ,服务器,存储, 应用软件 ,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。
云计算和大数据的关系
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。这些都太抽象,下面品途网记者应用生活场景给您解释二者的关系。
1.首先,云计算提供了最可靠、最安全的数据存储中心,用户不用再担心数据丢失、病毒入侵等麻烦。很多人觉得数据只有保存在自己看得见、摸得着的电脑里才最安全,其实不然。你的电脑可能会因为自己不小心而被损坏,或者被病毒攻击,导致硬盘上的数据无法恢复,而有机会接触你的电脑的不法之徒则可能利用各种机会窃取你的数据。此前轰动一时的“艳照门”事件据报道不也是因为电脑送修而造成个人数据外泄的吗?反之,当你的文档保存在类似百度云的网络服务上,你就再也不用担心数据的丢失或损坏。因为在“云”的另一端,有全世界最专业的团队来帮你管理信息,有全世界最先进的数据中心来帮你保存数据。同时,严格的权限管理策略可以帮助你放心地与你指定的人共享数据。这样,你不用花钱就可以享受到最好、最安全的服务,甚至比在银行里存钱还方便。
2.其次,云计算可以轻松实现不同设备间的数据与应用共享。大家不妨回想一下,你自己的联系人信息是如何保存的。一个最常见的情形是,你的手机里存储了几百个联系人的电话号码,你的个人电脑或笔记本电脑里则存储了几百个电子邮件地址。为了方便在出差时发邮件,你不得不在个人电脑和笔记本电脑之间定期同步联系人信息。买了新的手机后,你不得不在旧手机和新手机之间同步电话号码。
考虑到不同设备的数据同步方法种类繁多,操作复杂,要在这许多不同的设备之间保存和维护最新的一份联系人信息,你必须为此付出难以计数的时间和精力。这时,你需要用云计算来让一切都变得更简单。在云计算的网络应用模式中,数据只有一份,保存在“云”的另一端,你的所有电子设备只需要连接互联网,就可以同时访问和使用同一份数据。仍然以联系人信息的管理为例,当你使用网络服务来管理所有联系人的信息后,你可以在任何地方用任何一台电脑找到某个朋友的电子邮件地址,可以在任何一部手机上直接拨通朋友的电话号码,也可以把某个联系人的电子名片快速分享给好几个朋友。当然,这一切都是在严格的安全管理机制下进行的,只有对数据拥有访问权限的人,才可以使用或与他人分享这份数据。
3.最后,云计算为我们使用网络提供了几乎无限多的可能,为存储和管理数据提供了几乎无限多的空间,也为我们完成各类应用提供了几乎无限强大的计算能力。想像一下,当你驾车出游的时候,只要用手机连入网络,就可以直接看到自己所在地区的卫星地图和实时的交通状况,可以快速查询自己预设的行车路线,可以请网络上的好友推荐附近最好的景区和餐馆,可以快速预订目的地的宾馆,还可以把自己刚刚拍摄的照片或视频剪辑分享给远方的亲友„ 离开了云计算,单单使用个人电脑或手机上的客户端应用,我们是无法享受这些便捷的。个人电脑或其他电子设备不可能提供无限量的存储空间和计算能力,但在“云”的另一端,由数千台、数万台甚至更多服务器组成的庞大的集群却可以轻易地做到这一点。个人和单个设备的能力是有限的,但云计算的潜力却几乎是无限的。当你把最常用的数据和最重要的功能都放在“云”上时,我们相信,你对电脑、应用软件乃至网络的认识会有翻天覆地的变化,你的生活也会因此而改变。
以云计算为依托的大数据给企业带来的好处
大数据与云计算密不可分,它影响的不仅仅是我们的生活,它对于整个互联网行业甚至是线下行业都影响深远。过去我们的定势思维可能认为这种依托于云计算的大数据处理信息量极大,技术高深主要用户还都是像BAT这样的大型互联网企业,它们希望借此技术分析点击流数据。但今天,这项技术的使用已经不仅限于这些大型网络公司了,它正在走进任何你能想到的存有大量数据的公司。那它能为创业企业带来什么呢?
1. 大数据能拓展客户智能
所谓客户智能(customer intelligence)就是创新和使用客户知识,帮助企业提高优化客户关系的决策能力和整体运营能力的概念、方法、过程以及软件的集合。
从客户的角度来说,就是个简单的问题“你记得我吗”。对于拥有大量客户的企业来说,要能认出每个客户几乎是不可能的。但是时代改变了。企业可以利用大数据来辨认客户,细分客户类型,从而做出更有针对性的产品开发和营销策略。
那是怎么做到的?大数据能细查大范围的来源,包括结构性信息,比如购物历史、客户关系管理(CRM)数据和来自合作伙伴的知识,以及非结构性的信息,比如社交媒体。
大数据分析还能带来非结构性数据,如从社交媒体、博客、视频等来源收集的信息。利用这些信息分析,可以解答困扰公司多年的问题,比如客户行为、习惯和偏好等。利用这些数据,进行个性化的产品营销。
这里举一个百度新产品度秘的例子,品途网记者本人尝试和度秘聊天时它不仅仅可以推送你附近的餐馆。如果他推送你湘菜,你说你不吃辣,那么下次它便不会再推送味道偏辣的菜馆。更牛的是,如果你有孩子,他甚至可以利用你在网络上检索或购物的记录来推算你孩子的年龄并定期推送相关儿童产品和服务。
2. 大数据有利于最佳决策
使用大数据可以有效的改善商业决策和远瞻,比如定价、促销活动、投资和人员编制等,从而有效的节省时间和成本。
比如某购物网站想要让消费者更快的找到想要的商品,就搜集网站搜索方式和客户习惯的数据,改善搜索问题,通过利用大数据来正确的抉择网站的未来导向。最终该网站在改版后获得10%到15%的盈利额上涨。
还可以有助于企业自动决策,在实时搜集数据后,立刻进行调整,这种微调能带来更大效率,十分有意义。例如,你可以清楚地知道你们公司推出的那款服务更受欢迎,那款服务最容易遭受用户的抱怨。具体抱怨的点是什么,这样也就减少了投资等各方面的风险,使企业更加具有远瞻性,立于不败之地的可能性更大。
3. 大数据显示潜在商机
不仅能对于现有的状况做精确分析,大数据对于潜在的机会也有一定的把握。往往这些机遇非常不明显,很难挖掘,尤其是在新兴产品开发和行业中。而大数据能将这些有价值的信息透明化,令企业及时捕捉到,有利于新产品开发。
例如,有一家公司要开发农作物保险,为此该公司收集了50万个地点的天气和土壤状况、30兆数据。这些详尽的数据分析,显示了任何农作物在任一地点的种植风险,使该公司极大的减少了某些地区的投资风险。
大数据的应用正逐渐深入广泛,大数据价值的发挥,在开发利用好云计算的基础上,真正实现大产业、大机遇和大红利,未来,大数据必将掀起整个互联网领域的变革浪潮,商机无限。
数据的威胁
云计算和大数据对于创业者和公司负责人是十分利好的,但还处在初期,随着技术的发展它对公司运营的优势会不断显现,但是缺点也会显现。公司的数据安全和个人信息将会有越来越多被暴露的可能。但另一种更可怕的情景是,不管你是创业者还是用户,你的自由将被剥夺。当数据对你的了解超出你自己时这种情形便会显现,例如数据给你推送的服务过去你没有体验过,但是体验后让你十分满意,那么就可能造成“回声屋”现象。
麻省理工公民媒介中心主任给了我们答案:互联网造成“回声屋”现象,是指我们听到自己认可的观点时,会感到舒服,这种舒服的感觉会使人更愿意呆在自己的回声屋里。例如,社交媒体向我们推荐了更多好友,我们以为拓宽了事视野,其实这些人总和我们相似,因此加强了我们在这些背景中所形成的狭隘。
这就是知名电影《黑客帝国》中的场景。电影中,人们身处于数字陷阱之中,被机器奴役却浑然不知,还以为自己在这个世界里生活得很幸福。互联网连接世界却也带来人的分化。我们陷入自己的小世界里,成为数据的奴隶。
这些问题才刚刚显现,并没有得到重视。但未来,数据安全将影响着我们每一家企业和每一个人。解决的思路有两点:一方面要建立互联网数据安全法律是未来保证企业和个人的数据安全;另一方面则是不要过分依赖数据。品途网记者认为,数据只是人类的工具,而不是为了奴役人类而存在,过分依赖数据则会抹杀人类自我判断。对于创业者来说对于云计算和大数据我们既不可以视而不见也不可以将之奉为企业决策的根本。我们要拥抱技术,推动企业运作的更好,为用户提供更符合他们预期的产品,但是我们也要突破数据,找到更多的创新点。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
如何考取数据分析师证书:以 CDA 为例 在数字化浪潮席卷各行各业的当下,数据分析师已然成为企业挖掘数据价值、驱动决策的 ...
2025-07-15CDA 精益业务数据分析:驱动企业高效决策的核心引擎 在数字经济时代,企业面临着前所未有的数据洪流,如何从海量数据中提取有 ...
2025-07-15MySQL 无外键关联表的 JOIN 实战:数据整合的灵活之道 在 MySQL 数据库的日常操作中,我们经常会遇到需要整合多张表数据的场景 ...
2025-07-15Python Pandas:数据科学的瑞士军刀 在数据驱动的时代,面对海量、复杂的数据,如何高效地进行处理、分析和挖掘成为关键。 ...
2025-07-15用 SQL 生成逆向回滚 SQL:数据操作的 “后悔药” 指南 在数据库操作中,误删数据、错改字段或误执行批量更新等问题时有发生。 ...
2025-07-14t检验与Wilcoxon检验的选择:何时用t.test,何时用wilcox.test? t 检验与 Wilcoxon 检验的选择:何时用 t.test,何时用 wilcox. ...
2025-07-14AI 浪潮下的生存与进阶: CDA数据分析师—开启新时代职业生涯的钥匙(深度研究报告、发展指导白皮书) 发布机构:CDA数据科 ...
2025-07-13LSTM 模型输入长度选择技巧:提升序列建模效能的关键 在循环神经网络(RNN)家族中,长短期记忆网络(LSTM)凭借其解决长序列 ...
2025-07-11CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-11数据透视表中两列相乘合计的实用指南 在数据分析的日常工作中,数据透视表凭借其强大的数据汇总和分析功能,成为了 Excel 用户 ...
2025-07-11尊敬的考生: 您好! 我们诚挚通知您,CDA Level I和 Level II考试大纲将于 2025年7月25日 实施重大更新。 此次更新旨在确保认 ...
2025-07-10BI 大数据分析师:连接数据与业务的价值转化者 在大数据与商业智能(Business Intelligence,简称 BI)深度融合的时代,BI ...
2025-07-10SQL 在预测分析中的应用:从数据查询到趋势预判 在数据驱动决策的时代,预测分析作为挖掘数据潜在价值的核心手段,正被广泛 ...
2025-07-10数据查询结束后:分析师的收尾工作与价值深化 在数据分析的全流程中,“query end”(查询结束)并非工作的终点,而是将数 ...
2025-07-10CDA 数据分析师考试:从报考到取证的全攻略 在数字经济蓬勃发展的今天,数据分析师已成为各行业争抢的核心人才,而 CDA(Certi ...
2025-07-09【CDA干货】单样本趋势性检验:捕捉数据背后的时间轨迹 在数据分析的版图中,单样本趋势性检验如同一位耐心的侦探,专注于从单 ...
2025-07-09year_month数据类型:时间维度的精准切片 在数据的世界里,时间是最不可或缺的维度之一,而year_month数据类型就像一把精准 ...
2025-07-09CDA 备考干货:Python 在数据分析中的核心应用与实战技巧 在 CDA 数据分析师认证考试中,Python 作为数据处理与分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的有力工具 在数据分析的广袤领域中,准确捕捉数据的趋势变化以及识别 ...
2025-07-08备战 CDA 数据分析师考试:需要多久?如何规划? CDA(Certified Data Analyst)数据分析师认证作为国内权威的数据分析能力认证 ...
2025-07-08