cda

数字化人才认证

您的位置:首页 > 课程列表 > CDA大数据分析师周末班

  • WHAT 课程简介

    CDA大数据分析师课程以大数据分析技术为主线,以大数据分析师为培养目标,从数据分析基础、linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce、Hive和Hbase等理论知识和基于Spark平台的大数据分析和机器学习应用,详细演示Hadoop三种模式的安装配置,以案例的形式,讲解基于PySpark技术的回归、分类和聚类分析等大数据分析场景和案例。课程的重点是培养学员基于Hadoop架构的大数据分析实操能力,从零开始学习hadoop搭建,掌握Spark,手把手带练,8周成为行业急需的大数据分析人才,学完即可满足CDA LEVEL II大数据分析师考试知识考核需求。讲解案例包括但不限于金融大数据分析、气象大数据分析、Web海量日志大数据分析、智慧高速大数据分析等。
  • WHY 学习目标

    掌握使用Hadoop架构应用于大数据分析
    掌握使用大数据分析之数据库理论和工具Mysql、Hbase、Hive和Sqoop
    掌握使用Spark-SQL进行交互式数据查询
    掌握使用Spark-Streaming流式计算框架
    掌握使用Spark-MLlib进行机器学习
    掌握使用Spark-GraphX进行图计算
    掌握使用Pyspark进行大数据分析和机器学习
    掌握企业真实的大数据分析场景案例
  • WHO 学习对象和基础

    大数据业务工作迟迟得不到进展人士
    针对数据分析、数据挖掘岗位转型、提拔涨薪、技能优化等的职场白领
    未来准备从事大数据相关工作的计算机专业大学生人群
    需要有统计学基础和编程基础最佳(Java或Python)



课程案例,项目特训

点击图片任何区域可放大

高速公路收费站各站点每日收费额情况图 ...

案例介绍 将所有数据导入到 mysql 中,同时 hive 中,并编写 spark 程序, 统计出每天的交易额,并输出到 mysql 中,hive 中的数据, 编写 spark 程序,使用漏斗模型统计分析出某日数据增加的原因。 技能涉及 每天的数据为单位,将每天收费的环比增长率作为因变量,每个入口环比增长率为自变量,根据六个月的数据,建立多元线性回归模型,算出每个入口的贡献率(使用 hadoop+mysql+hive+spark+sqoop+tableau 完成)
点击图片任何区域可放大

Ubuntu使用Mysql创建表

案例介绍 根据给定文档在MySQL创建3个表并执行查询 技能涉及 1. 查看配置 show variable; 2.查看目前处理的列表; show processlist; 3.看看有哪些存储过程 show procedure status; 4.查看一条命令的执行方案 explain select * fromt t_your_tabe;
点击图片任何区域可放大

大数据交通案例

案例介绍 高速公路ETC交易数据,数据采集时间段为201X年一个季度的数据 技能涉及 1.所有的数据都导入到大数据平台上,使用hive进行数据的分布式存储 2.使用spark程序统计出每天的交易金额 3.分析每天交易金额的变化 4.综合考虑入口、出口、车型等综合因素,编写spark程序,使用漏斗模型统计分析出某日数据增加的原因 5.以每天的数据为单位,将每天收费的环比增长率作为因变量,每个入口环比增长率为自变量,根据三个月的数据,建立多元线性回归模型,算出每个入口的贡献率,为高速公路管理方出入口开放提供决策依据。
点击图片任何区域可放大

查看集群状态

案例介绍 集群运行中查看集群状态及集群信息 技能涉及 1 检查集群、节点、索引的健康情况 2 管理集群、节点,索引数据、元数据 3 执行CRUD,创建、读取、更新、删除 以及 查询 4 执行高级的查询操作,比如分页、排序、脚本、聚合等

01预习课程

01-01大数据分析基础
01-02Python编程基础知识
01-03Linux&Ubuntu操作系统基础

02大数据前沿应用与开源框架Hadoop

01-01大数据时代前沿与技术
01-02Hadoop生态系统和技术栈
01-03Hadoop单机环境搭建
01-04Hadoop伪分布式集群搭建
01-05Hadoop完全分布式集群搭建
01-06安装和使用Ubuntu系统
01-07HDFS分布式文件系统介绍
01-08HFDS进行文件读写操作
01-09MapReduce编程概念、框架和流程
01-10Hadoop & Yarn知识介绍

03分布式数据仓库技术-Hbase/Hive

01-01Hbase简介与架构
01-02Hbase集群模式安装
01-03Hbase Shell详解
01-04Hive基础知识
01-05Hive技术架构
01-06Hive DDL与DML语言介绍

04关系型数据库技术-Mysql理论及实战

01-01数据库的概念与技术、创建数据库
01-02数据表操作、数据类型与约束条件
01-03数据表插入数据与导入外部数据方法
01-04检查与修改数据表
01-05SQL常用函数介绍
01-06SQL单表查询与多表查询
01-07查询操作符与子查询
01-07SQL实战:使用SQL语句处理及查询电商业务数据

05分布式计算引擎-Spark入门

01-01Scala语法知识介绍
01-02Scala函数
01-03Scala对象操作
01-04Spark简介
01-05Spark运行架构
01-06RDD的创建和操作
01-07Spark SQL简介
01-07临时表和SQL查询

06分布式计算引擎-Spark进阶

01-01日志采集系统Flume和分布式消息队列Kafka入门
01-02流式计算框架Spark Streaming基本原理及使用方法
01-03流式计算框架Structured Streaming基本原理及使用方法
01-04Spark GraphX入门及基本使用方法
01-05分布式算法库Spark MlLib入门介绍
01-06Spark ML与Spark MLLib
01-07机器学习工作流
01-08机器学习项目-房价预测

07大数据可视化

01-01绘图思想的基本原理
01-02Python数据可视化包-Matplotlib介绍
01-03使用Matplotlib进行基本的图形绘制
01-04使用Python数据处理包Pandas做可视化
01-05Python数据可视化包-Seaborn介绍与图形绘制
01-06Python数据可视化包-Pyecharts介绍与图形绘制
01-07数据可视化技巧与方法

08大数据与Python结合-Pyspark机器学习

01-01Spark数据结构及编程语言接口
01-02PySpark开发环境搭建
01-03PySpark编程入门:Spark基本数据结构
01-04PySpark编程入门:PySpark常用语句
01-05Spark与分布式数据库和分布式数据仓库的集成方法
01-06采用PySpark读取分布式数据库中数据
01-07PySpark数据清洗案例
01-08数据挖掘和机器学习的基本思想与方法论
01-09机器学习部分算法串讲:有监督、无监督、半监督
01-10机器学习实战项目介绍

09大数据企业项目案例实做

01-01基于大数据平台的互联网金融监管实战
01-02大数据交通案例
01-03大数据金融案例

来自业界的数据领袖团队

  • 辛立伟

    CDA数据分析研究院讲师/系统架构师

    Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精 通Java企业级中间件技术设计、构建以及应用部署。
  • 倪向洋

    CDA数据分析研究院资深讲师

    CDA数据科学研究院大数据、python课程讲师,CDA命题委员会成员。曾经就职于IBM,有丰富的运维工作和大数据平台搭建经验。目前担任CDA大数据课程以及数据分析课程讲师,主要负责大数据平台搭建,利用机器学习对数据做清洗与分析的工作。擅长将机器学习,自动化运维与分析技术。
  • 赵仁乾

    CDA数据分析研究院讲师/北京邮电大学管理科学与工程硕士

    现就职于北京电信规划设计院,从事移动、联通集团及各省分公司市场、业务、财务规划、经济评价及运营咨询。重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析、潜在价值客户挖掘等。

几乎所有行业

都稀缺独当一面的CDA数据分析师®人才

在招聘市场上,越来越多的企业要求持CDA数据分析师®证书

GROWN

开启数据科学家成长之路

考核通过后,可获得CDA数据分析师中英文双证书,其中中文证书由教育部中国成人教育协会认可,英文证书由CDA INSTITUTE认证。
“CDA数据分析师认证”是一套科学化,专业化,国际化的人才考核标准,共分为CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ三个等级,涉及行业包括互联网、金融、咨询、电信、零售、医疗、旅游等,涉及岗位包括大数据、数据分析、市场、产品、运营、咨询、投资等。该标准符合当今全球数据科学技术潮流,可以为各行业企业和机构提供数据人才参照标准。
  • CDA LEVEL I

    人人皆需的职场数据思维与通用数据技能 数字化赋能 · 业务数据分析师

    面向范围

    • 零基础就业转行者、应届毕业生
    • 产品、运营、营销等业务岗与研发、技术岗在职者
    • 企业创始人、经理人、管理咨询类岗位从业者

    岗位去向

    商业(业务)分析师初级数据分析师
    (数据)产品运营(数字)市场营销
    数据专员...

  • CDA LEVEL II

    商业人才必备的数据分析流程与技能 中高级商业数据分析师

    面向范围

    • 产品、运营、营销等业务部门与研发、中台、技术类部门数据分析相关岗位在职者
    • 数字化转型企业创始人与数字化流程中相关负责人

    岗位去向

    数据分析师(数据)产品运营经理
    (数字)营销经理风控建模分析师
    量化策略分析师数据治理(质量)...

  • CDA LEVEL III

    数字化人才必备机器学习算法与高级数据科学应用 算法工程师 · 数据挖掘岗

    面向范围

    • 业务岗与技术岗从事数据分析、数据挖掘、机器学习等技术在职提升者
    • 从事算法科学、深度学习等工作的科研人员、分析师与工程师等

    岗位去向

    高级数据分析师机器学习工程师
    算法工程师数据科学家
    首席数据官...

EXAM

CDA认证报考开放化

CDA认证LEVELⅠ 对于考生的学历、专业、技能等没有限制性报考条件,在与全球计算机化考试服务商Pearson VUE达成深度合作后LEVELⅠ更是随报随考机制。
查看CDA认证报考流程 

VALUE

CDA证书的价值

  • 权威性AUTHORITY
    CDA数据分析师人才行业标准获得中成协的认可,由国际范围内数据科学领域行业专家、学者及知名企业共同制定并于每年修订更新,保证标准的公立性、权威性、专业性、前沿性,CDA证书已获得如中国银行、招商银行、中国烟草、IBM大数据大学,中国电信,国家电网,苏宁易购,德勤,猎聘,CDMS等企业机构的认可。
  • 专业性speciality
    CDA认证是根据数据科学专业岗位设立的科学化,专业化,国际化的人才考核标准。考试与国际知名考试服务机构Pearson VUE合作,随报随考、专家命题、评分公平、流程严格,更具含金量。
  • 权益性rights
    CDA持证人自动纳入为CDA会员并享有系列特殊权益。证书皆绑定考生真实身份,可在CDA认证考试中心查询,证书确保唯一性与防伪性,持证人还可获得电子徽章,加入到Linkedin个人档案中。证书三年审核一次,保证持证人的实力与权益。

RIGHTS

CDA持证人的权益

  • 会员资格

    吸纳为CDA Institute、CDA数据分析师俱乐部会员,活动中具有优先报名参与权

  • 职业发展

    可优先获得CDA内部就业及职业发展推荐

  • 免费CDA活动

    免费参与CDAS行业峰会等各项活动,CDA持证人享受特权位置

  • 兼职机会

    有机会加入CDA数据分析教学、研发等项目

  • 黄金会员

    免费享有AIU人工智能学院1个月黄金会员,内含国外前沿数据科学学习等海量资源

  • 免费资源

    经管之家论坛学习资源、优秀文献资料免费下载权

  • Q:课程使用的大数据软件版本是如何的?

    A:大数据软件使用版本如下: centos 7.2、hadoop-2.6.0、hive-1.1.0、sqoop-1.4.6、hbase-1.2.0、spark-2.3.0、zookeeper-3.4.5、Anconda5.2.0及以上、Oracle VM VirtualBox6 或者VMware
  • Q:课程的计算机内存要求和开发工具推荐?

    A:学习大数据课程计算机内存推荐为 16G (享受飞驰的感觉),至少8G。CPU推荐四核八线程的、硬盘可用空 间100G。关于内存是考虑了spark对内存的需求较大,大数据其他组件内存需求会低一些。
    关于开发工具:推荐pyspark使用jupyter notebook,Scala使用 IntelliJ IDEA 社区版,python脚本可以使用pycharm。
  • Q:大数据分析师和JAVA程序员有什么区别?

    A:Hadoop架构基于java程序设计,因此大批的IT人士在大数据时代找到了自己的职业锚,而且最快的进入了这个行业,成为了最先的大数据分析师。但IT人士的宿命就在于他们太IT了,他们热衷于计算更快、处理更高效的程序设计,而忽略了大数据分析的本意,为企业带来商业价值,因此他们只能是大数据分析工程师,而正真的大数据分析师应当了解和熟悉hadoop技术架构和算法设计,但不必成为一个优秀的JAVA程序员。
  • Q:大数据分析师区别于普通的数据分析师?

    A:普通的数据分析师具有一定的数理统计基础,熟悉业务逻辑,能熟练地操作传统的数据分析软件,能使数据成为企业的智慧。他们通常遇到的都是一些结构化、体量小的小数据。而大数据分析师更专注数据获取的架构设计、数据分析模型的选择、指标的选取,他们具有数据分析师的理论素养和业务能力,面对大数据,他们有一整套分布式的数据获取、整理、处理和分析的方案,而且这个方案最终的目标是为数据分析服务,他们具有大数据分析的利器,如Hadoop、Spark等软件。
  • Q:参加课可以考取的考取的证书有哪些?

    A:参加《CDA大数据分析师》证书每年6月和12月考试,通过者即可获得;培训后申请工信部《数据分析师》证书。
  • Q: 学员课下如何与老师进行互动?

    A:CDA大数据分析师课程每期都会建立QQ群和微信群,工作日有老师和助教负责答疑;同时学员可以在讨论区以帖子的形式向老师提问,老师会在工作日的48小时内回复。

OK