
CIO需要弄懂大数据的5个关键命题
企业大数据分析始于谷歌、雅虎和Twitter等互联网公司,与这些互联网公司类似,传统企业也迫切需要挖掘用户数据的价值,提高企业的竞争力和决策质量。以下是关于大数据CIO需要了解的五件事:
一、大数据的商业价值
今天,大数据分析所需的数据源和数据已经极大丰富并且在高速增长中,即使你是一家小企业,也可能会拥有大数据,一家小的对冲基金公司可能拥有数以TB计的数据,根据麦肯锡公司的一份报告,未来几年,包括医疗、公共服务、零售和制造业的企业都将从大数据分析中受益。
Hortonworks的首席技术官Eric Baldeschwieler认为,大家一提到大数据部署就想到Hadoop,Hadoop方案确实适用于各种客户:通过收集、分析交易数据,企业能更好地了解客户的需求和倾向,同时也能优化产品和服务创新,更快响应和处置紧急问题。
二、大数据的来源
有些CIO会认为企业里的数据还不够多,不足以构成大数据分析,其实数据就像海绵里的水,只要你愿意挤。Baldeschwieler认为很多时候大数据通常就是那些被丢弃到垃圾堆和回收站里的“垃圾”数据。
比方说,你的服务器日志就是很好的大数据分析素材。服务器记录所有访问你网站的访客和他们的访问行为。跟踪分析这些数据你将知道客户正在找什么,虽然日志数据分析不是什么新鲜事了,但其实分析的“粒度”还可以进一步精细到你之前无法想象的程度。
大数据的另一个重要来源是传感器,业界分析师已经鼓吹了多年的物联网,其实物联网说白了就是通过传感器把物理世界给数字化了,接入互联网的大量传感器将产生持续的大数据流,智能交通、智能电网甚至智能家电都将是大数据源,分析这些数据能大大提升相关企业的运营效率和决策质量。
三、大数据需要新型人才
根据Forrester Research的分析师James Kobielus认为:当部署完大数据分析系统后,企业接下来面对的最大挑战就是找到合适的人才使用这个系统分析数据。大数据非常依赖数据建模,企业需要补充各种类型的“数据科学家”,例如统计模型师、文本挖掘专家以及语义分析领域的专家。这些数据科学家需要具备的新技能与过去的商业智能专家的技能还有所不同。
大数据人才目前严重短缺,根据麦肯锡的报告,到2018年,美国市场还将短缺14-19万名高级数据分析人才,以及150万懂得使用大数据分析进行决策的经理人和分析师。
CIO需要具备的另外一个大数据技能是整合大量硬件来存储和分析数据,你可能还需要从当地大学或者研究机构招聘一些超级计算机管理员。
四、大数据无需事先规划
那些习惯缜密规划企业数据仓库(EDW)的CIO看到这里应该松口气,大数据的优势就是可以先收集,再考虑如何分析。
在数据仓库中,你必须在导入数据前先制定好数据架构。这意味着在导入数据前你必须知道你要什么,因为你在压缩数据的时候也会损失粒度,而且如果你改变主意了,或者想进行历史分析,这些数据架构就成了你给自己设置的障碍。
而大数据的存储库可以看做是一个大的垃圾场,你可以先把各种数据一窝蜂堆进去,然后再进行分析,很多企业在大数据分析之前都不是很清楚他们能发现什么,因此大数据在数据导入上的自由对于企业应用而言有着非同一般的意义。
五、大数据不仅仅是Hadoop
人们一说到大数据,就会提到Hadoop数据分析平台,Hadoop确实炙手可热,很多企业都在Hadoop方案上投入资金和人力,但实际上你还有其他软件选择。
法务研究机构巨头LexusNexus最近就无私地开源了其分析平台——HPCC系统。MarkLogic也公开了其非结构化数据库MarkLogic Server,可用于大数据分析。此外,Splunk的搜索引擎也在获得关注,可以用于搜索和分析机器数据,例如服务器日志。无论你希望从日志中提取何种数据,Splunk都很有可能帮上忙。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10