登录
首页精彩阅读大数据生态产业链,Kettle将在哪些环节出现?
大数据生态产业链,Kettle将在哪些环节出现?
2020-05-14
收藏

大数据作为继云计算、物联网之后IT行业又一颠覆性的技术,备受关注,要想知道大数据创业方向,一定要知道。Kettle作为ETL工具,在数据管理环节出现,那么我们一起来看看,大数据产业链包括哪几个环节

IT基础设施,包括提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务的企业,比如,提供数据中心解决方案的IBM、惠普和戴尔等,提供存储解决方案的EMC、提供虚拟化管理软件的微软、思杰、SUN、Redhat等。

数据源,大数据生态圈里的数据提供者,是生物(生物信息学领域的各类研究机构)大数据、交通(交通主管部门)大数据、医疗(各大医院 、体检机构)大数据、政务(政府部门)大数据、电商(淘宝、天猫、苏宁云商、京东等电商)大数据、社交网络(微博、微信、人人网等)大数据、搜索引擎(百度、谷歌等)大数据等各种数据的来源。

数据管理,包括数据抽取、转换、存储和管理等服务的各类企业或产品、如分布式文件系统(如HadoopHDFS和谷歌的GFS)、ETL工具(Informatica、Datastage、Kettle等)、数据库和数据仓库(Oracle、MySQLSQL Server、HBase、GreenPlum等)。

数据分析,包括提供分布式计算数据挖掘统计分析等服务的各类企业或产品,如分布式计算框架MapReduce、统计分析软件SPSS和SAS、数据挖掘工具Weka、数据可视化工具Tableau、BI工具(MicroStrategy、Cogons、BO)等。

数据平台,包括提供数据分享平台、数据分析平台、数据租售平台等服务的企业或产品,如阿里巴巴、谷歌、中国电信、百度等。

数据应用,提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业、机构或政府部门,如交通主管部门、各大医疗机构、菜鸟网络、国家电网等。

Kettle是数据管理时会用到的工具,大家可以了解下!

数据分析咨询请扫描二维码

客服在线
立即咨询