京公网安备 11010802034615号
经营许可证编号:京B2-20210330
课程介绍:
本课程即以Hadoop作为基础,包含Java基础讲解,并讲解Hadoop体系结构,安装管理,MapReduce编程以及基于Hadoop的上层软件Hive、Pig、HBase、Mahout、spark等软件的管理和应用。课程的重点放基于Hadoop架构的大数据分析思想及架构设计,通过演示实际的大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。适合零基础学员从零学起。
Hadoop大数据分析@第五期安排@北京 &远程
项目名称
CDA Hadoop大数据分析师
时间
12月26日-2016年1月17号 周六日(共8天)
地点
北京,人大经济论坛培训室
价格(元)
全程:8800(现场班)/5800(远程直播)
优惠
1. 全日制在读学生8折优惠(凭全日制学生证报名)
2. 提前一月报名并缴费立减500元
3. 参加过论坛其他现场班老学员9折优惠
4. 同一单位三人及以上报名9折优惠,五人及以上8折优惠
困学生
关于证书
可申请《数据分析师证书》,培训后即可得到
现场班福利
全套现场视频资料,终身学习,在线答疑
赠送《数据分析基础》视频一套
可2000元购买CDA LEVEL I 视频资料(原价2700元)
午餐,咖啡茶歇,论坛币(1000个)
最新课程大纲@北京&远程
5. 原价报名者将捐出100元作为助学基金,满3000捐赠贫
以上优惠不能累加
需单独申请(另交申请费用)
CDA_Hadoop大数据分析师第五期
时间
课程
大纲简介
预期效果
12.26
大数据前沿知识及hadoop入门
1.大数据前沿知识介绍
2.课程介绍
3. Linux及unbuntu系统基础
4.hadoop的单机和伪分布模式的安装配置
零基础入门,了解大数据的历史背景及发展方向,掌握hadoop的两种安装配置
12.27
Hadoop部署进阶
1.Hadoop集群模式搭建
3.使用hdfs提供的api进行hdfs文件操作
1.02-03
Java基础
1. java程序的基本框架
2. Java的数据类型与表达式介绍
3. java程序设计的基础
4.java的面向对象编程及方法
5.mysql数据库基础知识
零基础入门,了解java程序设计的基本思想,熟练利用eclipse进行简单的java程序设计,熟练使用jar文件,了解mysql等数据库管理系统的原理,了解基于web的程序开发流程
1.9
MapReduce理论及实战
1. Mapreduce概念及思想
2.mapreduce构架和流程
3.三个基于mapreduce的初级案例
4.mapreduce高级案例--人大经济论坛日志管理
熟悉MapReduce的工作原理及应用,熟悉基本的MapReduce程序设计,掌握根据大数据分析的目标设计和编写基于mapreduce的项目
1.10
hadoop+Mahout大数据分析
1. mahout学习之简介、安装及配置
2. 六个实战案例深入解析hadoop+mahout的大数据分析之分类、聚类与主题推荐
掌握基于hadoop+mahout的大数据分析方法的使用场景,熟练运用mahout的成熟算法进行特定场景的大数据分析
1.16
Hbase理论及实战
Spark、Hive的安装、配置及使用场景
1. hbase简介、安装及配置
2. hbase实战
掌握hbase的数据存储及项目实战
掌握Spark、Hive的安装、配置及使用场景
1.17
hadoop+Spark大数据分析
实战案例深入解析hadoop+Spark的大数据分析之分类、Logistic回归与主题推荐
基于hadoop+Spark的大数据分析方法的使用场景,熟练运用Spark的成熟算法进行特定场景的大数据分析
详细课程大纲请见:http://bbs.pinggu.org/thread-3515862-1-1.html
大数据爱好者可加群:174921162(学习交流)
学员对象:
1. 大数据分析,数据挖掘兴趣爱好者及转行人士
2. 职位晋升、薪酬提高人士
3. 在校数学,经济,计算机,统计等专业教师和学生
4. 各大数据项目负责人及其团队人士
师资团队
谢邦昌;台湾大学生物统计学博士,台湾著名大学天主教辅仁大学统计信息学系教授。现任中华数据挖掘协会(Chung-hua Data Mining Society,CDMS)理事长,辅仁大学统计资讯学系教授,华通人商用信息有限公司高级顾问。中国人民大学应用统计科学研究中心学术委员会委员。
曹正凤;具有多年的JAVA程序设计和统计教学经验,人大经济论坛CDA金牌讲师,目前致力于大数据分析前沿领域研究,主持人大经济论坛基于hadoop架构的论坛主题推荐系统项目,参与《大数据背景下基于中国烟草消费需求的供给结构分析研究》、《基于数据整合的空气质量测度方法研究》等大数据项目。
辛立伟 ;Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精通Java企业级中间件技术设计、构建以及应用部署;畅销书《Java从初学到精通》(电子工业出版社,2010年6月)一书作者。多次参与大数据分析课程教学。
张田圆;软通动力信息技术(集团)有限公司助理副总裁、智慧业务事业群 CTO。分管技术领域:云计算、大数据、大规模并发系统、智慧城市及众创空间等。
董轶群;计算机软件与理论硕士,吉林大学计算机体系结构博士,具有多年的JAVA程序设计和操作系统教学经验,教学方式和方法新颖,深受学员的好评。研究方向为智能规划、空间推理、基于大数据的时空信息系统。
王安;钱方银通科技有限公司,首席分析师。中国科学技术大学理论力学学士,中国科学院计算力学硕士,北京大学光华管理学院MBA。此前曾带领团队为多家大中型银行,保险公司提供风险管理,数据分析咨询服务,关注领域包括,定量化风险管理,互联网金融,大数据应用。
我们的服务
关于免费重听: 在参加本期之后的后续三期可以(并且只能)选择一期免费来听。
报名流程
1.在线填写报名信息 http://www.peixun.net/view/336_join.html
2.给予反馈,确认报名信息
3.网上缴费
4.开课前一周发送电子版课件和教室路线图
提前一个月报名缴费学员立减500元
(北京现场报名)
(全国远程报名)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22