
新联邦业务数据湖为颠覆大数据应用铺路
EMC公司今天发布联邦业务数据湖。这套完整的工程解决方案包括来自EMC信息基础设施、Pivotal和VMware的领先的存储及大数据分析技术,帮助客户利用大数据的新世界,从而扫清通向新洞察和颠覆性差异化道路的障碍。
方案可在短至七天内实施,联邦业务数据湖可极大简化构建一个数据湖所需的大量复杂任务,是专为企业需要的速度、自服务和可扩展性而设计,让组织能够通过使用大数据分析,开始更好地进行业务决策。作为一个来自EMC联邦的融合解决方案, 联邦业务数据湖将重新定义基础设施,最大化IT组织部署混合云和数据湖的速度和敏捷性,加入企业混合云解决方案。
大数据不可思议的潜力最初且最重要的是受传统应用、现代应用、传感器和智能设备数据增长驱动的,以及大量全新的公共数据,例如社交媒体订阅。基于廉价存储和无限计算的增长,以及通过新应用和产品让实时分析与直连行动成为可能的新技术,现在是有可能捕获并处理这类数据的。这些存储与分析技术,以及海量数据集共同组成业务数据湖。
业务数据湖正成为企业最优先考虑的事,因为它将填补传统数据仓库留下的一个关键空白。业务数据湖包含结构化和非结构化数据,来源各种各样,分析聚焦于建立模型以预测未来。成功部署数据湖的公司正利用数据和预测模型构建新产品、应用和业务模型,重新定义他们的行业,接管或延续其“市场领导者”的地位。
一个充分有效的业务数据湖将提供三项关键功能:
· 存储:面向所有种类的分析,存储许多不同数据源的结构化和非结构化数据,为分析用例提供所需的混合容量和性能。
· 分析:面向所有类型的分析场景,包括基于Hadoop的、In-Memory No-SQL和横向扩展MPP,提供现代化的数据管理和分析工具。
· 显露&行动:向用户提供数据和应用,实现结果的实时变化并影响关键决策。
直到今天,构建一个高效的数据湖一直都是困难且复杂的。对那些尝试部署数据湖的IT组织而言,他们必须为每个分析用例部署并配置正确的分析平台,以及相对应的存储,从Hadoop到实时。一旦环境被创建,数据必须在所有正确的访问权限和管理应用到数据集的情况下加载。环境和数据集的部署是一个复杂且耗时的任务,IT很难满足业务使用者的需求。
联邦业务数据湖解决方案
联邦业务数据湖解决方案让部署一个业务数据湖变得容易。核心产品来自EMC联邦公司,EMC信息基础设施、Pivotal和VMware,提供联邦业务数据湖的核心功能,满足关键需求:存储、分析、显露和行动。
联邦业务数据湖是一套完整的工程解决方案,能够快速自动化配置,让IT组织能够引领业务需求。分析层是完全虚拟化的,通过运行在Vblocks上的VMware实现,带预定义的分析用例,以及自动化安装与配置。EMC Isilon为数据湖提供存储基础,实现容量和性能的理想平衡。
分析层由Pivotal大数据套件,包括PivotalHD,世界领先的SQL-on-Hadoop引擎,HAWQ。Pivotal大数据套件提供企业级SQL,能在存储于Hadoop的数据基础上,与业内顶尖分析平台,如SAS、Tableau及其他实现无缝集成和互操作。EMC还提供两种额外的业务数据湖,为客户提供包括与Cloudera、Hortonworks在内的Hadoop 发行版集成的选项,以及未来任何基于开放数据平台的Hadoop发行版。
EMC数据湖服务:
一套完整服务和教育将与联邦业务数据湖一同可用,让处在大数据旅程不同阶段的客户都能够实施该解决方案,证明解决方案的价值并快速确定战略性的大数据用例,包括:
· EMC 技术管理服务:对那些准备好部署数据湖的客户,EMC技术管理服务提供完整的咨询服务,安装并部署联邦业务数据湖,优化分析环境,配置并自定义数据需求。
· EMC价值验证服务:对于那些知道用例但正寻求帮助,以部署最新的大数据分析,快速应用开发工具和技术的客户而言,价值验证服务论证了使用真实客户数据的特定用例的投资回报率。
· EMC大数据愿景研讨会:对那些尚未决定如何开始将大数据注入其业务策略的客户,EMC大数据愿景研讨会分析组织的战略、业务目标,然后划分特定用例的优先顺序,帮助组织开启大数据旅程。
· 教育服务:上述服务之外,EMC提供培训和认证,发展商业领袖和大数据实践者所需的从基础到高级的大数据和数据科学知识和技能。
供货
联邦业务数据湖将于2015年4月起定向供应一些国家。
客户证言:
“对那些一直寻求新收入流或节省成本的机会,保持市场地位的企业而言,像联邦业务数据湖这样帮助组织意识到大数据管理和存储新技术的解决方案是必不可少的。大数据解决方案让我们能够扩展我们的产品至包括Hadoop即服务在内,延伸Adobe数字营销能够为客户带来的价值。”
Adobe数字营销技术运营部总监 Dan Culter
分析师证言:
“连接设备的数量持续高涨,数字商业世界正扰乱传统的业务模式。现在不再是一个只与产品本身有关的时代了,而是与数据和数据的应用有关的时代。通过大数据,组织能够收集尽可能多的数据,采用分析技术理解数据,进行预测并采取行动,这样做的结果是新业务模式的产生。像联邦业务数据湖这样的大数据解决方案让组织能够将数据、分析和应用汇集,发展新业务机会。”
Wikibon大数据首席分析师Jeffrey Kelly
EMC管理层证言:
“几乎每一个传统的业务模式都面临着短期,持续的破坏。竞争优势的快车道将留给那些能够从大量增长的数据中快速拥抱并产生价值的企业。全新的联邦业务数据湖解决方案让利用所有种类数据,构建预测模型的过程更容易,使新应用、产品和业务模型能够重新定义行业。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29