CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

您的位置:首页 > 课程列表 > CDA大数据分析师周末班

CDA大数据分析师周末班

CDA大数据分析师周末班

难度系数:

课程系列:Level Ⅱ

周期:8周

课程信息:

8800

报考等级 考试通过后最高可返还25%学费
说明根据CDA GLOBAL最新政策,自2020.11.18起,所有参加CDA官网培训,同时缴费报考CDA LEVEL 中国区认证考试的学员,享受800元考试费用补贴。同时自报名日起一年内通过LEVEL I 返还15%学费、通过LEVEL Ⅱ返还20%学费、通过LEVEL Ⅲ返还25%学费。(返费不叠加,最高返还25%,考试费用不予退还,最终解释权归CDA所有)
  • Level I¥1200元
  • Level II¥1700元
  • Level III¥2000元
  • WHAT 课程简介

    CDA大数据分析师课程以大数据分析技术为主线,以大数据分析师为培养目标,从数据分析基础、linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce、Hive和Hbase等理论知识和基于Spark平台的大数据分析和机器学习应用,详细演示Hadoop三种模式的安装配置,以案例的形式,讲解基于PySpark技术的回归、分类和聚类分析等大数据分析场景和案例。课程的重点是培养学员基于Hadoop架构的大数据分析实操能力,从零开始学习hadoop搭建,掌握Spark,手把手带练,8周成为行业急需的大数据分析人才,学完即可满足CDA LEVEL II大数据分析师考试知识考核需求。讲解案例包括但不限于金融大数据分析、气象大数据分析、Web海量日志大数据分析、智慧高速大数据分析等。
  • WHY 学习目标

    掌握使用Hadoop架构应用于大数据分析
    掌握使用大数据分析之数据库理论和工具Mysql、Hbase、Hive和Sqoop
    掌握使用Spark-SQL进行交互式数据查询
    掌握使用Spark-Streaming流式计算框架
    掌握使用Spark-MLlib进行机器学习
    掌握使用Spark-GraphX进行图计算
    掌握使用Pyspark进行大数据分析和机器学习
    掌握企业真实的大数据分析场景案例
  • WHO 学习对象和基础

    大数据业务工作迟迟得不到进展人士
    针对数据分析、数据挖掘岗位转型、提拔涨薪、技能优化等的职场白领
    未来准备从事大数据相关工作的计算机专业大学生人群
    需要有统计学基础和编程基础最佳(Java或Python)



课程案例,项目特训

点击图片任何区域可放大

高速公路收费站各站点每日收费额情况图 ...

案例介绍 将所有数据导入到 mysql 中,同时 hive 中,并编写 spark 程序, 统计出每天的交易额,并输出到 mysql 中,hive 中的数据, 编写 spark 程序,使用漏斗模型统计分析出某日数据增加的原因。 技能涉及 每天的数据为单位,将每天收费的环比增长率作为因变量,每个入口环比增长率为自变量,根据六个月的数据,建立多元线性回归模型,算出每个入口的贡献率(使用 hadoop+mysql+hive+spark+sqoop+tableau 完成)
点击图片任何区域可放大

Ubuntu使用Mysql创建表

案例介绍 根据给定文档在MySQL创建3个表并执行查询 技能涉及 1. 查看配置 show variable; 2.查看目前处理的列表; show processlist; 3.看看有哪些存储过程 show procedure status; 4.查看一条命令的执行方案 explain select * fromt t_your_tabe;
点击图片任何区域可放大

大数据交通案例

案例介绍 高速公路ETC交易数据,数据采集时间段为201X年一个季度的数据 技能涉及 1.所有的数据都导入到大数据平台上,使用hive进行数据的分布式存储 2.使用spark程序统计出每天的交易金额 3.分析每天交易金额的变化 4.综合考虑入口、出口、车型等综合因素,编写spark程序,使用漏斗模型统计分析出某日数据增加的原因 5.以每天的数据为单位,将每天收费的环比增长率作为因变量,每个入口环比增长率为自变量,根据三个月的数据,建立多元线性回归模型,算出每个入口的贡献率,为高速公路管理方出入口开放提供决策依据。
点击图片任何区域可放大

查看集群状态

案例介绍 集群运行中查看集群状态及集群信息 技能涉及 1 检查集群、节点、索引的健康情况 2 管理集群、节点,索引数据、元数据 3 执行CRUD,创建、读取、更新、删除 以及 查询 4 执行高级的查询操作,比如分页、排序、脚本、聚合等

01预习课程

01-01大数据分析基础
01-02Python编程基础知识
01-03Linux&Ubuntu操作系统基础

02大数据前沿应用与开源框架Hadoop

01-01大数据时代前沿与技术
01-02Hadoop生态系统和技术栈
01-03Hadoop单机环境搭建
01-04Hadoop伪分布式集群搭建
01-05Hadoop完全分布式集群搭建
01-06安装和使用Ubuntu系统
01-07HDFS分布式文件系统介绍
01-08HFDS进行文件读写操作
01-09MapReduce编程概念、框架和流程
01-10Hadoop & Yarn知识介绍

03分布式数据仓库技术-Hbase/Hive

01-01Hbase简介与架构
01-02Hbase集群模式安装
01-03Hbase Shell详解
01-04Hive基础知识
01-05Hive技术架构
01-06Hive DDL与DML语言介绍

04关系型数据库技术-Mysql理论及实战

01-01数据库的概念与技术、创建数据库
01-02数据表操作、数据类型与约束条件
01-03数据表插入数据与导入外部数据方法
01-04检查与修改数据表
01-05SQL常用函数介绍
01-06SQL单表查询与多表查询
01-07查询操作符与子查询
01-07SQL实战:使用SQL语句处理及查询电商业务数据

05分布式计算引擎-Spark入门

01-01Scala语法知识介绍
01-02Scala函数
01-03Scala对象操作
01-04Spark简介
01-05Spark运行架构
01-06RDD的创建和操作
01-07Spark SQL简介
01-07临时表和SQL查询

06分布式计算引擎-Spark进阶

01-01日志采集系统Flume和分布式消息队列Kafka入门
01-02流式计算框架Spark Streaming基本原理及使用方法
01-03流式计算框架Structured Streaming基本原理及使用方法
01-04Spark GraphX入门及基本使用方法
01-05分布式算法库Spark MlLib入门介绍
01-06Spark ML与Spark MLLib
01-07机器学习工作流
01-08机器学习项目-房价预测

07大数据可视化

01-01绘图思想的基本原理
01-02Python数据可视化包-Matplotlib介绍
01-03使用Matplotlib进行基本的图形绘制
01-04使用Python数据处理包Pandas做可视化
01-05Python数据可视化包-Seaborn介绍与图形绘制
01-06Python数据可视化包-Pyecharts介绍与图形绘制
01-07数据可视化技巧与方法

08大数据与Python结合-Pyspark机器学习

01-01Spark数据结构及编程语言接口
01-02PySpark开发环境搭建
01-03PySpark编程入门:Spark基本数据结构
01-04PySpark编程入门:PySpark常用语句
01-05Spark与分布式数据库和分布式数据仓库的集成方法
01-06采用PySpark读取分布式数据库中数据
01-07PySpark数据清洗案例
01-08数据挖掘和机器学习的基本思想与方法论
01-09机器学习部分算法串讲:有监督、无监督、半监督
01-10机器学习实战项目介绍

09大数据企业项目案例实做

01-01基于大数据平台的互联网金融监管实战
01-02大数据交通案例
01-03大数据金融案例

来自业界的数据领袖团队

  • 辛立伟

    CDA数据分析研究院讲师/系统架构师

    Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精 通Java企业级中间件技术设计、构建以及应用部署。
  • 倪向洋

    CDA数据分析研究院资深讲师

    CDA数据科学研究院大数据、python课程讲师,CDA命题委员会成员。曾经就职于IBM,有丰富的运维工作和大数据平台搭建经验。目前担任CDA大数据课程以及数据分析课程讲师,主要负责大数据平台搭建,利用机器学习对数据做清洗与分析的工作。擅长将机器学习,自动化运维与分析技术。
  • 赵仁乾

    CDA数据分析研究院讲师/北京邮电大学管理科学与工程硕士

    现就职于北京电信规划设计院,从事移动、联通集团及各省分公司市场、业务、财务规划、经济评价及运营咨询。重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析、潜在价值客户挖掘等。

几乎所有行业

都稀缺独当一面的CDA数据分析师®人才

在招聘市场上,越来越多的企业要求持CDA数据分析师®证书

GROWN

开启数据科学家成长之路

考核通过后,可获得CDA数据分析师中英文双证书,其中中文证书由教育部中国成人教育协会认可,英文证书由CDA INSTITUTE认证。
“CDA数据分析师认证”是一套科学化,专业化,国际化的人才考核标准,共分为CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ三个等级,涉及行业包括互联网、金融、咨询、电信、零售、医疗、旅游等,涉及岗位包括大数据、数据分析、市场、产品、运营、咨询、投资等。该标准符合当今全球数据科学技术潮流,可以为各行业企业和机构提供数据人才参照标准。
  • CDA LEVEL I

    业务数据分析师

    面向零基础、业务领域(包括市场、营销、运营、产品、咨询、财务等),无需编程技术,能力要求:统计基础、SQL数据库、数据处理、常用建模分析。
  • CDA LEVEL II

    建模分析师

    面向数据挖掘、机器学习、建模分析相关技术与业务岗,助企业实现客户生命周期管理、风控、精准营销等业务目标。能力要求:数据挖掘理论与算法,数据处理技术,项目建模分析。
  • CDA LEVEL II

    大数据分析师

    面向从事大数据架构、分析、应用相关岗位,助企业搭建大数据平台并实现大数据分析应用。能力要求:Java、Python技术,Hadoop理论,数据(仓)库,机器学习算法,Mahout、Spark等工具应用。
  • CDA LEVEL III

    数据科学家

    面向有三年以上工作经验的资深数据岗,为企业培养具有综合实力的首席数据官。能力要求:计算机科学技术,大数据处理与架构设计,机器学习与深度学习,项目管理。

EXAM

CDA认证报考开放化

CDA认证LEVELⅠ 对于考生的学历、专业、技能等没有限制性报考条件,在与全球计算机化考试服务商Pearson VUE达成深度合作后LEVELⅠ更是随报随考机制。CDA教育课程的学员在学习过程中可提前申请考试,但“免报考费”仅有一次机会,望大家谨慎使用!
查看CDA认证报考流程 

VALUE

CDA证书的价值

  • 权威性AUTHORITY
    CDA数据分析师人才行业标准获得中成协的认可,由国际范围内数据科学领域行业专家、学者及知名企业共同制定并于每年修订更新,保证标准的公立性、权威性、专业性、前沿性,CDA证书已获得如中国银行、招商银行、中国烟草、IBM大数据大学,中国电信,国家电网,苏宁易购,德勤,猎聘,CDMS等企业机构的认可。
  • 专业性speciality
    CDA认证是根据数据科学专业岗位设立的科学化,专业化,国际化的人才考核标准。考试与国际知名考试服务机构Pearson VUE合作,随报随考、专家命题、评分公平、流程严格,更具含金量。
  • 权益性rights
    CDA持证人自动纳入为CDA会员并享有系列特殊权益。证书皆绑定考生真实身份,可在CDA认证考试中心查询,证书确保唯一性与防伪性,持证人还可获得电子徽章,加入到Linkedin个人档案中。证书三年审核一次,保证持证人的实力与权益。

RIGHTS

CDA持证人的权益

  • 会员资格

    吸纳为CDA Institute、CDA数据分析师俱乐部会员,活动中具有优先报名参与权

  • 职业发展

    可优先获得CDA内部就业及职业发展推荐

  • 免费CDA活动

    免费参与CDAS行业峰会等各项活动,CDA持证人享受特权位置

  • 兼职机会

    有机会加入CDA数据分析教学、研发等项目

  • 黄金会员

    免费享有AIU人工智能学院1个月黄金会员,内含国外前沿数据科学学习等海量资源

  • 免费资源

    经管之家论坛学习资源、优秀文献资料免费下载权

  • Q:课程使用的大数据软件版本是如何的?

    A:大数据软件使用版本如下: centos 7.2、hadoop-2.6.0、hive-1.1.0、sqoop-1.4.6、hbase-1.2.0、spark-2.3.0、zookeeper-3.4.5、Anconda5.2.0及以上、Oracle VM VirtualBox6 或者VMware
  • Q:课程的计算机内存要求和开发工具推荐?

    A:学习大数据课程计算机内存推荐为 16G (享受飞驰的感觉),至少8G。CPU推荐四核八线程的、硬盘可用空 间100G。关于内存是考虑了spark对内存的需求较大,大数据其他组件内存需求会低一些。
    关于开发工具:推荐pyspark使用jupyter notebook,Scala使用 IntelliJ IDEA 社区版,python脚本可以使用pycharm。
  • Q:大数据分析师和JAVA程序员有什么区别?

    A:Hadoop架构基于java程序设计,因此大批的IT人士在大数据时代找到了自己的职业锚,而且最快的进入了这个行业,成为了最先的大数据分析师。但IT人士的宿命就在于他们太IT了,他们热衷于计算更快、处理更高效的程序设计,而忽略了大数据分析的本意,为企业带来商业价值,因此他们只能是大数据分析工程师,而正真的大数据分析师应当了解和熟悉hadoop技术架构和算法设计,但不必成为一个优秀的JAVA程序员。
  • Q:大数据分析师区别于普通的数据分析师?

    A:普通的数据分析师具有一定的数理统计基础,熟悉业务逻辑,能熟练地操作传统的数据分析软件,能使数据成为企业的智慧。他们通常遇到的都是一些结构化、体量小的小数据。而大数据分析师更专注数据获取的架构设计、数据分析模型的选择、指标的选取,他们具有数据分析师的理论素养和业务能力,面对大数据,他们有一整套分布式的数据获取、整理、处理和分析的方案,而且这个方案最终的目标是为数据分析服务,他们具有大数据分析的利器,如Hadoop、Spark等软件。
  • Q:参加课可以考取的考取的证书有哪些?

    A:参加《CDA大数据分析师》证书每年6月和12月考试,通过者即可获得;培训后申请工信部《数据分析师》证书。
  • Q: 学员课下如何与老师进行互动?

    A:CDA大数据分析师课程每期都会建立QQ群和微信群,工作日有老师和助教负责答疑;同时学员可以在讨论区以帖子的形式向老师提问,老师会在工作日的48小时内回复。

OK