cda

数字化人才认证

您的位置:首页 > 课程列表 > CDA大数据分析师周末班

  • WHAT 课程简介

    CDA大数据分析师周末班:CDA大数据分析师课程以大数据分析技术为主线,以大数据分析师为培养目标,从数据分析基础、linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce、Hive和Hbase等理论知识和基于Spark平台的大数据分析和机器学习应用,详细演示Hadoop三种模式的安装配置,以案例的形式,讲解基于PySpark技术的回归、分类和聚类分析等大数据分析场景和案例。课程的重点是培养学员基于Hadoop架构的大数据分析实操能力,从零开始学习hadoop搭建,掌握Spark,手把手带练,8周成为行业急需的大数据分析人才,学完即可满足CDA LEVEL II大数据分析师考试知识考核需求。讲解案例包括但不限于金融大数据分析、气象大数据分析、Web海量日志大数据分析、智慧高速大数据分析等。
  • WHY 学习目标

    掌握使用Hadoop架构应用于大数据分析
    掌握使用大数据分析之数据库理论和工具Mysql、Hbase、Hive和Sqoop
    掌握使用Spark-SQL进行交互式数据查询
    掌握使用Spark-Streaming流式计算框架
    掌握使用Spark-MLlib进行机器学习
    掌握使用Spark-GraphX进行图计算
    掌握使用Pyspark进行大数据分析和机器学习
    掌握企业真实的大数据分析场景案例
  • WHO 学习对象和基础

    大数据业务工作迟迟得不到进展人士
    针对数据分析、数据挖掘岗位转型、提拔涨薪、技能优化等的职场白领
    未来准备从事大数据相关工作的计算机专业大学生人群
    需要有统计学基础和编程基础最佳(Java或Python)



课程案例,项目特训

点击图片任何区域可放大

高速公路收费站各站点每日收费额情况图 ...

案例介绍 将所有数据导入到 mysql 中,同时 hive 中,并编写 spark 程序, 统计出每天的交易额,并输出到 mysql 中,hive 中的数据, 编写 spark 程序,使用漏斗模型统计分析出某日数据增加的原因。 技能涉及 每天的数据为单位,将每天收费的环比增长率作为因变量,每个入口环比增长率为自变量,根据六个月的数据,建立多元线性回归模型,算出每个入口的贡献率(使用 hadoop+mysql+hive+spark+sqoop+tableau 完成)
点击图片任何区域可放大

Ubuntu使用Mysql创建表

案例介绍 根据给定文档在MySQL创建3个表并执行查询 技能涉及 1. 查看配置 show variable; 2.查看目前处理的列表; show processlist; 3.看看有哪些存储过程 show procedure status; 4.查看一条命令的执行方案 explain select * fromt t_your_tabe;
点击图片任何区域可放大

大数据交通案例

案例介绍 高速公路ETC交易数据,数据采集时间段为201X年一个季度的数据 技能涉及 1.所有的数据都导入到大数据平台上,使用hive进行数据的分布式存储 2.使用spark程序统计出每天的交易金额 3.分析每天交易金额的变化 4.综合考虑入口、出口、车型等综合因素,编写spark程序,使用漏斗模型统计分析出某日数据增加的原因 5.以每天的数据为单位,将每天收费的环比增长率作为因变量,每个入口环比增长率为自变量,根据三个月的数据,建立多元线性回归模型,算出每个入口的贡献率,为高速公路管理方出入口开放提供决策依据。
点击图片任何区域可放大

查看集群状态

案例介绍 集群运行中查看集群状态及集群信息 技能涉及 1 检查集群、节点、索引的健康情况 2 管理集群、节点,索引数据、元数据 3 执行CRUD,创建、读取、更新、删除 以及 查询 4 执行高级的查询操作,比如分页、排序、脚本、聚合等

01预习课程

01-01大数据分析基础
01-02Python编程基础知识
01-03Linux&Ubuntu操作系统基础

02大数据前沿应用与开源框架Hadoop

01-01大数据时代前沿与技术
01-02Hadoop生态系统和技术栈
01-03Hadoop单机环境搭建
01-04Hadoop伪分布式集群搭建
01-05Hadoop完全分布式集群搭建
01-06安装和使用Ubuntu系统
01-07HDFS分布式文件系统介绍
01-08HFDS进行文件读写操作
01-09MapReduce编程概念、框架和流程
01-10Hadoop & Yarn知识介绍

03分布式数据仓库技术-Hbase/Hive

01-01Hbase简介与架构
01-02Hbase集群模式安装
01-03Hbase Shell详解
01-04Hive基础知识
01-05Hive技术架构
01-06Hive DDL与DML语言介绍

04关系型数据库技术-Mysql理论及实战

01-01数据库的概念与技术、创建数据库
01-02数据表操作、数据类型与约束条件
01-03数据表插入数据与导入外部数据方法
01-04检查与修改数据表
01-05SQL常用函数介绍
01-06SQL单表查询与多表查询
01-07查询操作符与子查询
01-07SQL实战:使用SQL语句处理及查询电商业务数据

05分布式计算引擎-Spark入门

01-01Scala语法知识介绍
01-02Scala函数
01-03Scala对象操作
01-04Spark简介
01-05Spark运行架构
01-06RDD的创建和操作
01-07Spark SQL简介
01-07临时表和SQL查询

06分布式计算引擎-Spark进阶

01-01日志采集系统Flume和分布式消息队列Kafka入门
01-02流式计算框架Spark Streaming基本原理及使用方法
01-03流式计算框架Structured Streaming基本原理及使用方法
01-04Spark GraphX入门及基本使用方法
01-05分布式算法库Spark MlLib入门介绍
01-06Spark ML与Spark MLLib
01-07机器学习工作流
01-08机器学习项目-房价预测

07大数据可视化

01-01绘图思想的基本原理
01-02Python数据可视化包-Matplotlib介绍
01-03使用Matplotlib进行基本的图形绘制
01-04使用Python数据处理包Pandas做可视化
01-05Python数据可视化包-Seaborn介绍与图形绘制
01-06Python数据可视化包-Pyecharts介绍与图形绘制
01-07数据可视化技巧与方法

08大数据与Python结合-Pyspark机器学习

01-01Spark数据结构及编程语言接口
01-02PySpark开发环境搭建
01-03PySpark编程入门:Spark基本数据结构
01-04PySpark编程入门:PySpark常用语句
01-05Spark与分布式数据库和分布式数据仓库的集成方法
01-06采用PySpark读取分布式数据库中数据
01-07PySpark数据清洗案例
01-08数据挖掘和机器学习的基本思想与方法论
01-09机器学习部分算法串讲:有监督、无监督、半监督
01-10机器学习实战项目介绍

09大数据企业项目案例实做

01-01基于大数据平台的互联网金融监管实战
01-02大数据交通案例
01-03大数据金融案例

来自业界的数据领袖团队

  • 辛立伟

    CDA数据分析研究院讲师/系统架构师

    Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精 通Java企业级中间件技术设计、构建以及应用部署。
  • 倪向洋

    CDA数据分析研究院资深讲师

    CDA数据科学研究院大数据、python课程讲师,CDA命题委员会成员。曾经就职于IBM,有丰富的运维工作和大数据平台搭建经验。目前担任CDA大数据课程以及数据分析课程讲师,主要负责大数据平台搭建,利用机器学习对数据做清洗与分析的工作。擅长将机器学习,自动化运维与分析技术。
  • 赵仁乾

    CDA数据分析研究院讲师/北京邮电大学管理科学与工程硕士

    现就职于北京电信规划设计院,从事移动、联通集团及各省分公司市场、业务、财务规划、经济评价及运营咨询。重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析、潜在价值客户挖掘等。

几乎所有行业

都稀缺独当一面的CDA数据分析师®人才

在招聘市场上,越来越多的企业要求持CDA数据分析师®证书

GROWN

开启数据科学家成长之路

考核通过后,可获得CDA数据分析师中英文双证书,其中中文证书由中国成人教育协会数据分析教育培训专业委员会监制,英文证书由CDA INSTITUTE 认证。
“CDA数据分析师认证”是一套科学化,专业化,国际化的人才考核标准,共分为CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ三个等级,涉及行业包括互联网、金融、咨询、电信、零售、医疗、旅游等,涉及岗位包括大数据、数据分析、市场、产品、运营、咨询、投资等。该标准符合当今数据科学技术潮流,可以为各行业企业和机构提供数据人才参照标准。
  • CDA LEVEL I

    人人皆需的职场数据思维与通用数据技能

    面向范围

    • 零基础就业转行者、应届毕业生
    • 产品、运营、营销等业务岗与研发、技术岗在职者
    • 企业创始人、经理人、管理咨询类岗位从业者

    岗位去向

    商业(业务)分析师初级数据分析师
    (数据)产品运营(数字)市场营销
    数据专员...

  • CDA LEVEL II

    企业数字化发展中必备的数据分析流程与技能

    面向范围

    • 产品、运营、营销等业务部门与研发、中台、技术类部门数据分析相关岗位在职者
    • 数字化转型企业创始人与数字化流程中相关负责人

    岗位去向

    数据分析师(数据)产品运营经理
    (数字)营销经理风控建模分析师
    量化策略分析师数据治理(质量)...

  • CDA LEVEL III

    企业数字化发展中必备的高级数据分析方法与技术

    面向范围

    • 业务岗与技术岗从事数据分析、数据挖掘、机器学习等技术在职提升者
    • 从事算法科学、深度学习等工作的科研人员、分析师与工程师等

    岗位去向

    高级数据分析师机器学习工程师
    算法工程师数据科学家
    首席数据官...

EXAM

CDA认证报考开放化

CDA认证LEVELⅠ 对于考生的学历、专业、技能等没有限制性报考条件,在与全球计算机化考试服务商Pearson VUE达成深度合作后LEVELⅠ更是随报随考机制。
查看CDA认证报考流程 

VALUE

CDA证书的价值

  • 共识性CONSENSUS
    CDA数据分析师标准由中国成人教育协会数据分析教育培训专业委员会监制,国际范围内的数据科学领域的行业专家、学者及知名企业共同制定并于每年更新,逐步推动数据人才标准的行业共识。
  • 专业性speciality
    CDA认证是根据数据科学专业岗位设立的科学化,专业化,国际化的人才考核标准。考试与国际知名考试服务机构Pearson VUE合作,随报随考、专家命题、评分公平、流程严格,更具含金量。
  • 权益性rights
    CDA持证人自动纳入为CDA会员并享有系列特殊权益。证书皆绑定考生真实身份,可在CDA认证考试中心查询,证书确保唯一性与防伪性,持证人还可获得电子徽章,加入到Linkedin个人档案中。证书三年审核一次,保证持证人的实力与权益。

RIGHTS

CDA持证人的权益

  • 会员资格

    吸纳为CDA Institute、CDA数据分析师俱乐部会员,活动中具有优先报名参与权

  • 职业发展

    可优先获得CDA内部就业及职业发展推荐

  • 免费CDA活动

    免费参与CDAS行业峰会等各项活动,CDA持证人享受特权位置

  • 兼职机会

    有机会加入CDA数据分析教学、研发等项目

  • 黄金会员

    免费享有AIU人工智能学院1个月黄金会员,内含国外前沿数据科学学习等海量资源

  • 免费资源

    经管之家论坛学习资源、优秀文献资料免费下载权

  • Q:课程使用的大数据软件版本是如何的?

    A:大数据软件使用版本如下: centos 7.2、hadoop-2.6.0、hive-1.1.0、sqoop-1.4.6、hbase-1.2.0、spark-2.3.0、zookeeper-3.4.5、Anconda5.2.0及以上、Oracle VM VirtualBox6 或者VMware
  • Q:课程的计算机内存要求和开发工具推荐?

    A:学习大数据课程计算机内存推荐为 16G (享受飞驰的感觉),至少8G。CPU推荐四核八线程的、硬盘可用空 间100G。关于内存是考虑了spark对内存的需求较大,大数据其他组件内存需求会低一些。
    关于开发工具:推荐pyspark使用jupyter notebook,Scala使用 IntelliJ IDEA 社区版,python脚本可以使用pycharm。
  • Q:大数据分析师和JAVA程序员有什么区别?

    A:Hadoop架构基于java程序设计,因此大批的IT人士在大数据时代找到了自己的职业锚,而且最快的进入了这个行业,成为了最先的大数据分析师。但IT人士的宿命就在于他们太IT了,他们热衷于计算更快、处理更高效的程序设计,而忽略了大数据分析的本意,为企业带来商业价值,因此他们只能是大数据分析工程师,而正真的大数据分析师应当了解和熟悉hadoop技术架构和算法设计,但不必成为一个优秀的JAVA程序员。
  • Q:大数据分析师区别于普通的数据分析师?

    A:普通的数据分析师具有一定的数理统计基础,熟悉业务逻辑,能熟练地操作传统的数据分析软件,能使数据成为企业的智慧。他们通常遇到的都是一些结构化、体量小的小数据。而大数据分析师更专注数据获取的架构设计、数据分析模型的选择、指标的选取,他们具有数据分析师的理论素养和业务能力,面对大数据,他们有一整套分布式的数据获取、整理、处理和分析的方案,而且这个方案最终的目标是为数据分析服务,他们具有大数据分析的利器,如Hadoop、Spark等软件。
  • Q:参加课可以考取的考取的证书有哪些?

    A:参加《CDA大数据分析师》证书每年6月和12月考试,通过者即可获得;培训后申请工信部《数据分析师》证书。
  • Q: 学员课下如何与老师进行互动?

    A:CDA大数据分析师课程每期都会建立QQ群和微信群,工作日有老师和助教负责答疑;同时学员可以在讨论区以帖子的形式向老师提问,老师会在工作日的48小时内回复。

OK