
云计算和大数据——信息化发展的推动剂_数据分析师
技术革新对信息化发展的引领与推动作用已经毋庸置疑,而新一波以云计算和大数据为代表的新技术对我国信息化的拉动作用也正日益显现。在5月21日举行的第六届中国云计算大会上,中国云计算与产业联盟理事长吴基传表示,随着云计算服务的互联,移动互联网、智慧城市等领域的渗透相互促进,形成了市场需求与技术进步双拉动的态势,为我国信息产业和服务的发展提供了强大的动力。他强调,云计算与大数据相辅相成、相得益彰,大数据挖掘处理需要云计算作为平台,同时,大数据涵盖的价值和规律又使云计算能够更好地与行业应用结合发挥更大的作用。
大数据是杀手级应用
在工信部电信研究院泰尔管理研究所许亭看来,要理解云计算、大数据与信息化的关系,必须明确两个前提,即云计算是什么?大数据是什么?
许亭认为,云计算的本质是将分散的资源(包括计算、存储、软件等)集中起来形成共享的资源池,并以动态按需方式向用户提供服务。其基本物理表现形式是数据中心,但是技术形式已发生革命性的变化,大量低成本的服务器集群正替代传统的专用大型机和小型机,并从强调单机性能向虚拟化、分布式方向发展,从而形成了“胖服务器瘦终端”的新形式。
大数据的本质则是数据本身特征发生巨变(数据体量大、结构多样性、处理实时性),带来数据处理技术和思维的变革,并应用到经济、社会各领域,从而产生巨大的价值。大数据的产生是多种因素共同作用的结果,互联网、物联网等信息技术带来数据的大量产生,云计算则使得数据存储成本大幅下降,而分布式处理技术使得数据处理能力大幅增强。
因此,“在信息化过程中,云计算是加速信息化过程的基础设施,而大数据是信息化的杀手级应用,这也是云计算和大数据作用于信息化的机理”,许亭表示。
云计算是加速信息化过程的基础设施。具体表现为,以往企业信息化需要自己购买、建设和维护信息系统和设备(如高性能服务器等),这对于中小企业是不小的成本负担,从而一定程度上阻碍了企业信息化的进程。而云计算使得企业能够像买水、买电一样,很方便地买到自身所需的计算、存储、软件等基础设施能力,并且是用户按需购买、即用即付,有效降低了信息化成本,促进了经济社会各领域的全面信息化。
信息化加速大数据的产生,大数据则是信息化的杀手级应用。首先,信息化过程使得现实世界全面数据化,特别是互联网、物联网技术的扩散,现实世界产生数据世界,加速了大数据产生。其次,大数据又成为信息化的杀手级应用,这种新型的数据处理技术和思维应用到经济社会中就产生了巨大的价值。麦肯锡报告指出,大数据应用于美国零售业,能够帮助其净利润增长60%,应用于制造业,能够帮助其节省50%的成本。
企业加大云计算投资
基于上述原因,云计算与大数据的普及和应用,无疑会整体推动我国信息化水平的提升。那么从行业应用的角度,又应如何利用云计算及大数据如何提升我国信息化的整体水平?
从行业应用的角度来说,云计算可以帮助中小企业迅速完成信息化。比如通过PhiCloud的云主机自助式服务平台,中小企业主只要轻轻点击,就能够开通并实时调整所需IT资源,且所有的服务器后台运作都在数据中心内轻松完成。此外,每个员工的办公软件、通信IP电话、邮箱、公司业务流程审批系统等都能够在PhiCloud的云集中找到,并按照用户数量在线开通,瞬间完成企业的所有信息化过程。
事实上,云计算在企业信息化过程中对成本的降低作用,以及大数据对企业生产经营的帮助,已经使得很多企业尝到了甜头,并推动各行业加强对云计算和大数据的投资。市场研究公司Market Research Media表示,全球云计算服务市场正在以每年约30%速度增长,预计到2020年其市场规模将达到2700亿美元。同时,也有相关机构预测,2014年中国会有近80%的企业增加在云计算领域投资,云计算与大数据应用将以政府、电信、教育、医疗、金融、石油石化和电力等行业为重点,逐步被越来越多的企业和机构采用。
六大问题亟需解决
近日,国家信息中心公布的中国信息社会测评报告显示,2013年中国信息社会总指数(ISI)达到0.4712,我国仍处于工业社会向信息社会加速转型的历史进程中。在此阶段,加快调整与改革,逐步消除发展不利因素,加强教育培训,提高信息素质是主要任务。因此,尽管技术的革新和应用的创新是目前我国信息化建设的主色调,但在云计算及大数据作用于信息化建设的过程中,同样也还存在着一些问题亟需解决。
目前,我国云计算的发展主要面临两大问题:信息安全的问题和服性能稳定性的问题。根据《中国公共云服务发展调查报告》,云服务的稳定性、安全性是用户主要看重的因素。由于云服务的性能依赖于众多环节,包括数据中心、宽带网络、终端设备等,因此,如果没有高性能、稳定、无所不在的传输带宽,就无法保证稳定的云服务。对此,一方面要健全云计算信息安全相关的法律法规和监管体系;另一方面要加快网络宽带建设,夯实云计算发展基础。
大数据应用则主要面临四大问题:一是数据流通不畅,拥有数据的机构或企业由于法律等顾虑开放数据程度有限,使得拥有技术的企业“巧妇难为无米之炊”;二是数据安全和隐私保护的制约;三是大数据技术工具还不成熟,仍处于不断进化中,即使是较为成熟的Hadoop体系,其应用门槛仍然较高;四是,大数据应用刚刚起步,呈现阶梯状扩散(从互联网领域向其他行业领域扩散),要想全面推广还需要时间。因此,一方面,要加强数据安全和个人隐私保护,在明确数据开放标准、数据交易规则的基础上,逐步推进政府和公共数据资源的开放;另一方面,要促进大数据前沿技术创新和扩散,特别是在Hadoop开源生态体系方面,同时推动政府和交通、医疗等公共领域的大数据应用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30