京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据系列之大数据分析对IT资源的需求
为了准确描述中国大数据市场和技术发展趋势,解析大数据发展的各阶段对IT技术的需求,2013年6月,中桥调研咨询对中国480家最终用户的IT管理者和专业人员,就大数据市场和技术发展趋势展开了调查。中桥首席分析师"数据分析师"结合其在欧美数据中心领域十几年的市场调研积累,对中国大数据市场趋势的调查数据进行解析,以诠释中国大数据市场和技术趋势。同时,会通过在线讲座(www.webinars-china.com )和中国读者解读中国大数据市场趋势,以及大数据对IT技术、IT架构、IT管理以及IT格局的影响。中桥结合对中国大数据市场的调研数据和分析,将分成四个系列对“中国大数据价值和趋势”进行解读。
在系列1里,中桥就大数据分析对未来24个月以及企业的大数据分析投入重点进行分析。在系列2 里,中桥将就大数据分析对IT资源的需求,包括IT架构、计算节点以及存储技术等进行分析。
大数据分析对IT架构的需求
在大数据时代,随着数据存储量的爆炸性增长以及分层网络架构的出现,IT复杂性达到了前所未有的高度,而大数据分析使得传统IT架构更是不堪重负。那么从企业角度来看,他们的大数据环境需要怎样的IT架构呢?中桥调查结果表明(图1),企业级用户(员工人数在1000人以上)主要选择的是“透明、经济、智能、自动化”的IT架构(29.3%),中小企业(员工人数在1000人以下)则主要选择的是一体机方案(服务器、存储、网络、大数据分析软件)(28.9%)。企业级用户倾向于开放、异构、跨平台的IT架构,因为其用于大数据分析的IT架构发展较为成熟,如何继续提高BI效率是企业级用户选择IT架构的重点。中小企业尚处于IT架构发展初期,因此一体机的方案成为中小企业的首选。受访者的选择结果也体现了中国企业未来对IT架构的需求趋势,说明数据整合和ETL是中国企业的迫切需求,也是目前面临的最大问题之一。
图1. 大数据环境对IT架构的需求
大数据分析对计算技术的需求
再从大数据分析的计算方式来看(图2),21.6%和21.3%的企业级用户分别考虑x86虚拟化和小型机来部署大数据分析方案,中小企业(23.8%)则主要考虑刀片服务器的计算方式。刀片服务器的高密度特点有利于提高计算能力、保持高IT密度。企业级的应用多数运行在小型机的平台上,这造成如果大数据分析是在现有基础上实现,则小型机就成为了企业级的首选;如果要选择在一个全新平台实现大数据分析,那么X86虚拟化就成为了企业级用户的第一选择。结合我们之前所分析的,目前中国市场的大数据分析速度和频率远低于欧美市场,这导致中国企业在数据分析,这个大数据通过IT创造价值,这一重要环节上比较薄弱。

▲图2.大数据分析对计算技术的需求
大数据分析对存储的需求
从大数据分析的第一个环节——数据收集和存储来看,大数据时代应用数量、应用数据量和使用者数量的增长,对存储IOPS以及OLTP和OLAP的要求越来越高,具体体现在存储不能满足业务关键型应用的需求。从数据分析师就企业支持当前数据分析和/或进程活动的存储类型分析来看(图3),FC SAN是企业级用户(42.1%)和中型企业(34.0%)的首选,远高于其他存储类型的企业占比。这是因为FC SAN对OLTP和OLAP的性能稳定性优于其他存储技术。这一调查结果也体现了,目前中国用户大多处于大数据分析的第一阶段,存储和IT架构大多以集中式为主。随着Hadoop和MapReduce的不断普及,用户逐渐进入近实时和实时分析阶段,节点式存储的占比会随之逐渐增加。

▲图3.大数据分析对存储的需求
那么在大数据时代企业的存储能够满足需求呢(图4)?中桥调研结果显示,31.6%的用户计划在未来12个月部署新存储来满足业务关键型应用的需求,33.2%计划在未来12-24个月部署新存储。这表明传统存储越来越无法满足业务关键应用的性能需求。在未来24个月,64.8%的用户将会部署新存储来满足大数据时代,业务关键型应用对存储性能越来越高的需求。

▲图4 大数据分析时代存储的发展趋势
通过上述一系列大数据对IT资源的需求分析,中桥分析师"数据分析师"认为,传统的IT架构、计算方式以及存储正成为中国用户通过大数据分析处理快速提高IT效率,挖掘数据价值的巨大阻碍。而统一、透明、智能的自动化IT架构管理、高密度下卓越的计算能力,以及能够满足存储IOPS与OLTP和OLAP的新型存储则能够为企业创造价值,实现通过IT突破创新来提升企业竞争力的目的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22