京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大多数企业不懂大数据
大数据是用来描述数据规模巨大、数据类型复杂的数据集,它本身蕴含着丰富的价值。尽管它已成为媒体和专家热议的话题,但在企业中的热度还相对较低,因为大多数的企业还不知道如何利用它。
一般来说,一旦某个概念被宣传得天花乱坠,人们也开始更关注其背后的意义。Gartner副总裁兼著名分析师Debra Logan表示,大多数企业正开始试图搞清楚大数据是什么。但她认为,95%-97%的组织或者外部研究机构对大数据还只是处于探索阶段,关于大数据实施等相关问题和大数据价值的研究才刚刚起步。
1.大数据实施情况
与Logan意见相冲突的是,微软调查显示,75%的大中型企业将在未来的12个月内实施大数据相关的项目或计划。对此,Logan对该调查的动机和数据都持怀疑态度。
她表示,大数据分析公司的盈利来源于企业越来越多的数据,企业的数据越是非结构化、杂乱无章,大数据的作用才能发挥的更淋漓尽致。
一些组织在大数据领域已经取得一定进展,尤其是零售行业,通过RFID、供应链、会员卡上的海量数据,挖掘出更多有价值的信息,帮助商场更好的运营和盈利。此外,网络和广播行等媒体业也是大数据的先锋用户,例如BBC,就利用大数据分析平台实现用户访问数据分析与优化。
他特别提到,由于银行产生的数据更有组织更结构化,因此银行反而不是大数据先锋领域。不过银行业在大数据领域也积极跟进,例如通过对资金流、结算、信贷、支付等过程产生的数据进行分析,增强客户粘度和挖掘大数据的价值。他们也想了解hadoop,了解这样的技术架构以及如何进行数据分析,但还处于早期阶段。
2.大数据的基础设施投资误区
Gartner数据显示,2013年年底,有关大数据的项目支出将达到340亿美元,其中大部分与大数据的基础设施投资有关。
Logan表示,除了零售和媒体行业,不应让大数据基础设施投资成为企业商业计划的核心部分。她也希望企业的投资计划更多的倾向技术人才,例如聘请数据科学家或者数据分析团队,而不仅仅关注IT基础设施的投入。
很多企业都在努力让大数据的投资带来更多的商业利益,但在很多的情况下,太多的信息不受控,也并不一定能带来与之匹配的效益。因为大多数用户有一个很奇怪的心态–不舍得丢任何东西,企业在删除数据时也举棋不定。但有些数据并不能产生价值,反而会带来投资浪费。企业如何站在专业的角度,对数据进行有效取舍?
大数据存储和处理的成本实在是太高,因此通过第三方获取大数据服务显得更有意义。通过租用第三方的基础设施,企业可分析海量数据,并基于此优化自身业务流程,这种模式的服务,企业何乐不为?
3.大数据的人才挑战
大数据眼下面临的最大挑战就是缺乏具备独特的技术能力或专业知识的人才储备。
大数据的绝大部分数据都是原始数据,它们不能直接读取和分析,需要一些要具备特定的技能的分析师进行基于预言建模或未来趋势分析。
只有借助精通于统计和数学原理的骨干专家,建立高级分析模型,才能发现趋势和隐藏的模式,使大数据真正发挥作用,而一般的开发者以及传统的数据分析师,并不具备开发预言分析应用程序模型的技能,因此需要花费一定的时间和精力使技术团队成员适应大数据的需求。
Logan戏称,目前真正懂得大数据的人目前也许在欧洲核研究中心,以及一些天体物理学应用研究的专门机构,因为这些科研机构产生的数据更海量,这里的科学家们也具备更专业的统计、建模、分析能力。
Logan表示,目前有不少企业正在试图通过咨询公司获得更多专业帮助,但苦于缺乏专业的分析人员,只能自己慢慢摸索。而普通分析师与专业大数据科学家之间的技能储备差距,对市场而言是挑战也更是机遇。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据可视化领域,树状图(Tree Diagram)是呈现层级结构数据的核心工具——无论是电商商品分类、企业组织架构,还是数据挖掘中 ...
2025-11-17核心结论:“分析前一天浏览与第二天下单的概率提升”属于数据挖掘中的关联规则挖掘(含序列模式挖掘) 技术——它聚焦“时间序 ...
2025-11-17在数据驱动成为企业核心竞争力的今天,很多企业陷入“数据多但用不好”的困境:营销部门要做用户转化分析却拿不到精准数据,运营 ...
2025-11-17在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07