
高速膨胀 大数据引发技术革命
随着互联网、云计算、移动通讯技术发展,数据成为人们不可缺少的重要资产,对人们生活起着重要作用。大数据(Big data)分析从各种各样结构化和非结构化数据中获取有价值信息,帮助企业进行商业决策。哈佛大学量化社会科学院院长Gary King表示,大数据正在引起一场技术革命,没有哪个领域不会受到影响。
大数据是企业、机构和互联网用户产生的结构化和非结构化数据统称,如电力公司客户数据库、商业客户数据库、互联网广告、搜索索引、博客和电子邮件等。网络新闻杂志CMS Wire报导说,由于包含客户喜好和购买打算等重要资讯,大数据越来越受到企业和机构重视。
但是,由于大量化、多样化和快速化的特点,大数据的抓取、处理、管理和整合颇具挑战性。《环球邮报》报导说,加拿大IT公司Fuseforward向市场推出云计算大数据平台ICE,提供大数据获取、分析和整合应用程序,帮助大公司和政府机构优化能源系统,如削减城市基础设施系统的电力能源消耗。
高速膨胀 大数据影响广泛
市场谘询公司IDC的研究数据显示,全球数据每2年翻一番,每天生产相当于17.5万个美国国货图书馆的数据。2010年,互联网所产生的数据量超过之前所有年份的总和。2011年,全球大数据达到1.8万亿GB,互联网生产4.8万亿个在线广告,107万亿个电子邮件。
预计2013年,互联网数据将达到7,162亿GB。IDC预计,未来10年全球数据量将以超过40%的速度增长,2020年全球大数据将达35万亿GB,为2011年的19.4倍。
2010年,IBM和微软等公司的数据管理和分析软件开发的开支为15亿美元。谘询公司Data Corp预计,大数据工业产值2015年将达到169亿,比2010年增长428%。
美国德州IT谘询公司Gartner副主席David Newman认为,数据将成为人们不可缺少的重要资产,企业开发产品和拓宽市场等商业决策将依赖于大数据。
数据分析技术匮乏 困扰企业
研究公司Aberdeen最近发表调查报告数据显示,90%的公司被大数据困扰,苦于没有合适的分析软件。企业亟需能够及时而准确分析客户消费需求和购买意向的大数据应用软件。
Aberdeen资深研究员Trip Kucera认为,大数据面临的另外一个挑战是,如何把从杂乱无章数据中获取的有价值信息整合到其他商业应用软件系统之中,帮助企业进行自动化商业决策。
根据Aberdeen调查报告,45%的企业表示,技术或数学模型的缺乏使得大数据分析结果很难与公司其他商业软件系统进行整合应用,公司往往是人工使用大数据分析结果。只有26%受调查企业认为没有困难使用大数据,这一比例在受调查的大企业中也不到一半。
另外,分析软件准确度取决于数据来源和质量,商用交易和行为数据有较高质量,而互联网和社交网数据具有较低质量。
根据Aberdeen调查报告,商用客户交易和行为数据能够比较准确的反应顾客消费需求和购物意向,而互联网和社交网用户数据在这方面的准确性较差。 63%-81%的企业使用商用客户交易或行为数据进行客户分析,只有24%-41%的企业使用互联网或社交网数据进行客户分析。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02