京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据产品不仅仅是IT工具_数据分析师
对于企业的业务人员,特别是数据科学家人群来说,Informatica的Intelligent Data Platform不仅是一个智能化的大数据预处理工具,而且可以像业务系统一样为企业带来直接的价值。
互联网企业通常会强调细节和微创新,把产品的某一项功能做到极致,借此牢牢吸引大量用户。但是企业级厂商则不同,它们更倾向于将产品平台化。平台化的好处是可以把尽量多的功能集成在一起,方便部署与管理,而且可以借平台屏蔽底层架构的复杂性。软件厂商尤喜平台化,比如数据保护厂商有数据保护和统一管理平台,大数据产品厂商有大数据处理通用平台等。
今年5月,独立企业数据集成软件提供商Informatica在一年一度的Informatica World上发布了Intelligent Data Platform。作为下一代数据平台,Intelligent Data Platform可以在正确的时间提供正确的数据,并通过铺设一条虚拟数据的高速公路,将人员、位置、设备以更加智能化的方式紧密联系在一起,为大数据应用提供更好的支持。
提升智能化水平
Intelligent Data Platform包含三大核心:第一,Informatica Vibe虚拟数据机。Vibe是一种嵌入式的数据处理引擎,可以提供针对任何位置、格式或来源的数据的普遍的访问能力,且支持客户“一次映射,多次部署”;第二,数据基础设施。数据基础设施层能够在任何规模的环境中系统、连续地交付干净、安全、互连的数据,从部门级到企业级,从事务数据到大数据,从内部部署到云端皆可;第三,数据智能。Informatica独创的数据智能层将为客户重新定位数据基础设施层所创建的元数据,从而提高数据的可见性,改善决策过程,并提升运营的智能化水平。
Intelligent Data Platform能够以正确的方式将正确的数据传递给相关的人员或发送到正确的位置。Informatica公司大中国区首席产品顾问但彬归纳了Intelligent Data Platform的主要功能:Informatica可以在正确的时间提供最高质量的正确数据;Informatica能够将数据交付到正确的位置,包括企业内部或云端;Informatica 可以将数据交付给正确的人员,无论是IT人员、分析师、数据管理员,还是业务用户;Informatica可以将数据交付给正确的设备,包括联网设备或自动化决策系统;Informatica能以正确的方式交付数据,并确保数据安全可靠、经过授权且已获得保护。
Intelligent Data Platform在Informatica World 2014大会上一发布,即受到了与会的Informatica的用户的普遍欢迎。Informatica在大会上展示了一系列Intelligent Data Platform的应用案例,包括自助服务数据集成(Springbok 项目)、数据导向型安全管理(Secure@Source 项目)和360 度全方位业务实体(MDM 10)等。目前,Intelligent Data Platform还没有完全商品化。之所以在Informatica World 2014提前发布Intelligent Data Platform,Informatica是想在产品正式发布前先听听用户的反馈,然后根据用户的反馈进一步对Intelligent Data Platform进行完善,再择机发布商用化的版本。这种在产品正式发布前先与客户进行交流已经成了Informatica开发新产品的一个惯例。
为数据科学家服务
有业内人士指出,大数据已经发展到一个新的阶段,仍然按照传统商业智能(BI)的思路和方法解决大数据的问题已经不合时宜。传统BI采用包括数据采集、存储、处理、分析和呈现等环节在内的纵向数据处理方式,而新的大数据处理和利用方式则是分布式、扁平化的。
传统的数据处理方式是模式化的,用户需要什么,厂商就提供什么样的解决方案,但这些解决方案通常是固定的、不能灵活扩展的。如果用户提出了新的要求,想在原有系统中增添新功能或进行修改会十分麻烦。而Intelligent Data Platform可以解决这一问题,因为它是一个智能化的平台,可以为集中到“数据湖”中的各种类型的数据建立相关性,然后再提供给业务应用或通过接口与分析工具衔接。
在进行大数据处理时,传统的数据库和分析技术还有用吗?但彬认为,传统技术与新技术之间不是谁对谁错的问题,而是要针对不同的应用选择适合的技术。比如,银行常见的商业行为分析仍然可以采用数据库技术,而一些预测性的大数据挖掘项目则要采用新的大数据处理技术,呈现数据之间的关联性。
“Intelligent Data Platform给用户带来的最大改变是解放了IT人员。原来IT人员既要做业务也要搞技术。未来,我们希望IT人员可以把工作重心放在做开发和系统集成上,而业务人员可以基于Intelligent Data Platform将业务描述得更清楚,并且可以自动生成一些规则。”但彬介绍说。
支撑Intelligent Data Platform的底层技术是Informatica的Vibe虚拟数据机,它也是所有Informatica产品的基础引擎。在这个引擎之上,Informatica可以帮助客户进行数据集成,提升数据质量。Intelligent Data Platform是一个集成化的平台,从IT的角度讲,其实施肯定会存在一些挑战,但它确实能给企业的业务带来更多价值。“IT人员可以完成数据的抽取和存储,然后提交数据用于分析。”但彬告诉记者,“但是企业的业务人员或数据科学家可以标记数据的质量、发现问题,从数据中发现更多有价值的东西。所以,我们希望业务人员能借助Intelligent Data Platform更多地接触和利用数据,而不仅仅是IT人员。”
在推出Intelligent Data Platform的同时,Informatica还提出了“数据湖”的概念。所谓数据湖,就是将不同来源的数据存放在一起,但并不是将未经处理的数据简单地堆放在一起,而是要将这些数据进行预先处理,建立数据之间的联系,这更有利于日后的大数据处理。
大数据是业务系统
传统的数据处理与分析都是IT人员的事,因此IT人员必须掌握丰富的数学知识和计算机技术。但是,大数据的最终目标是为企业业务和应用服务,而IT人员通常不太了解业务,这就造成了大数据技术与应用的脱节。但彬表示,Intelligent Data Platform最理想的使用者是企业的业务人员或数据科学家,因为他们更了解业务需求,可以利用Intelligent Data Platform更好地解读大数据分析结果。
大数据处理系统是一个IT工具,还是业务系统呢?不同的定位决定了大数据处理系统的不同“命运”。“中国的很多客户通常将大数据处理系统当成一个IT工具来使用。从IT运维的角度来看,IT人员只负责保证系统的正常运行、开关,虽然偶尔也会编写一些代码,但毕竟不能从业务的角度充分利用大数据处理系统。在这种情况下,大数据处理系统只是一个IT支撑和保障系统,而不能直接给企业带来商业价值。”但彬介绍说,“如果将大数据处理系统当成一个业务系统来对待,那么业务人员就可以利用这个平台更好地挖掘数据,给业务带来直接的价值。”
据记者了解,一个具有单一功能的大数据产品可能需要几十万元,而一套比较完善的大数据整体解决方案的价格可能达到上千万元。如果不能充分发挥大数据产品应有的价值,那么对企业来说无疑是一种巨大的浪费。但彬表示:“如果企业只把大数据产品当成一个IT工具,那么可能不会持续地对产品进行升级,也不会购买厂商的专业服务,一旦遇到解决不了的问题,就可能轻易放弃。”
Informatica曾经带国内某银行的技术人员去美国与Informatica的客户交流。让但彬吃惊的是,美国客户参与交流的全是公司的业务人员,讲的全是业务系统如何运行。参与交流的中国客户全是技术人员,想了解的是美国企业如何构建一个大数据系统,而不太关心系统如何运行和如何给企业带来价值。如此强烈的反差给中国的用户提了一个醒:第一,部署大数据应用应该以业务为中心和出发点;第二,企业最好自己主导大数据系统的部署与应用,因为企业最了解自身的业务需求,可以更充分地利用大数据平台,提高数据分析的效率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16