热线电话:4000-51-9191

就学培训网

登录
首页系统课大数据分析进修班
大数据分析进修班
大数据分析进修班
  • 远程班 随报随学

课程简介

大数据分析进修班:培训师资目前均来自学界、实务界相关领域的讲师、教授、专家、工程师以及企业资深分析师,名师荟萃。CDA大数据符合企业用人需求,从大数据编程——数据库编程——大数据仓库——大数据分析方法——数据挖掘算法——大数据真实项目应用——大数据解决方案等,主要软件应用Hadoop、HDFS、MapReduce、Hbase、Hive、Sqoop等理论知识和大数据平台生态环境,重点学习数据分析基础和数据挖掘经典算法实现,Spark大数据分析工具和Python完美结合让你事半功倍。

学习目标

1.零基础脱产学习,1个月精学大数据技术
2.计算机、统计、数学等专业学习更佳
3.包学会,成为大数据稀缺人才,高薪就业
4.CDA大数据就业帮,助你前程似锦
5.大数据未来已来,只等你改变自己

学习对象和基础

1.各行业数据分析、数据挖掘从业者
2.在校数学,计算机,统计等专业教师和学生
3.经济,医学生物研究院科研人员
4.数据分析,数据挖掘兴趣爱好者及转行人士

14分布式集群架构

14-01大数据行业前沿应用与知识介绍
14-02Linux入门基础
14-03Hadoop入门介绍
14-04Hadoop单机环境搭建
14-05Hadoop伪分布式集群搭建
14-06Hadoop完全分布式集群搭建

15分布式文件存储系统HDFS

15-01HDFS简介
15-02HDFS编程入门
15-03HDFS读写文件
15-04HDFS架构原理及常用指令

16ETL工具Sqoop基本原理和常用指令

16-01Sqoop介绍
16-02Sqoop原理
16-03Sqoop部署
16-04关系型数据库导入Hadoop
16-05Hadoop导入关系型数据库
16-06Sqoop job应用

17大数据仓库知识应用

17-01Hive架构原理和技术方向
17-02HiveQL数据查询、函数(聚合函数、窗口函数、UDF)
17-03Hbase表设计及数据查询
17-04商业应用案例—宽表设计与用户画像
17-05商业应用案例—网站流量分析与页面运营

18Spark架构原理和核心组件

18-01Spark介绍
18-02Spark数据结构及编程语言接口
18-03Spark与分布式数据库和分布式数据仓库的集成方法

19PySpark编程指南与Spark RDD相关操作

19-01PySpark开发环境搭建
19-02PySpark编程入门:Spark基本数据结构
19-03PySpark编程入门:PySpark常用语句
19-04采用PySpark读取分布式数据库中数据
19-05PySpark数据清洗案例

20Spark MLLib与机器学习算法实践