
课程介绍:
本课程即以Hadoop作为基础,包含Java基础讲解,并讲解Hadoop体系结构,安装管理,MapReduce编程以及基于Hadoop的上层软件Hive、Pig、HBase、Mahout、spark等软件的管理和应用。课程的重点放基于Hadoop架构的大数据分析思想及架构设计,通过演示实际的大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。适合零基础学员从零学起。
Hadoop大数据分析@第五期安排@北京 &远程
项目名称
CDA Hadoop大数据分析师
时间
12月26日-2016年1月17号 周六日(共8天)
地点
北京,人大经济论坛培训室
价格(元)
全程:8800(现场班)/5800(远程直播)
优惠
1. 全日制在读学生8折优惠(凭全日制学生证报名)
2. 提前一月报名并缴费立减500元
3. 参加过论坛其他现场班老学员9折优惠
4. 同一单位三人及以上报名9折优惠,五人及以上8折优惠
困学生
关于证书
可申请《数据分析师证书》,培训后即可得到
现场班福利
全套现场视频资料,终身学习,在线答疑
赠送《数据分析基础》视频一套
可2000元购买CDA LEVEL I 视频资料(原价2700元)
午餐,咖啡茶歇,论坛币(1000个)
最新课程大纲@北京&远程
5. 原价报名者将捐出100元作为助学基金,满3000捐赠贫
以上优惠不能累加
需单独申请(另交申请费用)
CDA_Hadoop大数据分析师第五期
时间
课程
大纲简介
预期效果
12.26
大数据前沿知识及hadoop入门
1.大数据前沿知识介绍
2.课程介绍
3. Linux及unbuntu系统基础
4.hadoop的单机和伪分布模式的安装配置
零基础入门,了解大数据的历史背景及发展方向,掌握hadoop的两种安装配置
12.27
Hadoop部署进阶
1.Hadoop集群模式搭建
3.使用hdfs提供的api进行hdfs文件操作
1.02-03
Java基础
1. java程序的基本框架
2. Java的数据类型与表达式介绍
3. java程序设计的基础
4.java的面向对象编程及方法
5.mysql数据库基础知识
零基础入门,了解java程序设计的基本思想,熟练利用eclipse进行简单的java程序设计,熟练使用jar文件,了解mysql等数据库管理系统的原理,了解基于web的程序开发流程
1.9
MapReduce理论及实战
1. Mapreduce概念及思想
2.mapreduce构架和流程
3.三个基于mapreduce的初级案例
4.mapreduce高级案例--人大经济论坛日志管理
熟悉MapReduce的工作原理及应用,熟悉基本的MapReduce程序设计,掌握根据大数据分析的目标设计和编写基于mapreduce的项目
1.10
hadoop+Mahout大数据分析
1. mahout学习之简介、安装及配置
2. 六个实战案例深入解析hadoop+mahout的大数据分析之分类、聚类与主题推荐
掌握基于hadoop+mahout的大数据分析方法的使用场景,熟练运用mahout的成熟算法进行特定场景的大数据分析
1.16
Hbase理论及实战
Spark、Hive的安装、配置及使用场景
1. hbase简介、安装及配置
2. hbase实战
掌握hbase的数据存储及项目实战
掌握Spark、Hive的安装、配置及使用场景
1.17
hadoop+Spark大数据分析
实战案例深入解析hadoop+Spark的大数据分析之分类、Logistic回归与主题推荐
基于hadoop+Spark的大数据分析方法的使用场景,熟练运用Spark的成熟算法进行特定场景的大数据分析
详细课程大纲请见:http://bbs.pinggu.org/thread-3515862-1-1.html
大数据爱好者可加群:174921162(学习交流)
学员对象:
1. 大数据分析,数据挖掘兴趣爱好者及转行人士
2. 职位晋升、薪酬提高人士
3. 在校数学,经济,计算机,统计等专业教师和学生
4. 各大数据项目负责人及其团队人士
师资团队
谢邦昌;台湾大学生物统计学博士,台湾著名大学天主教辅仁大学统计信息学系教授。现任中华数据挖掘协会(Chung-hua Data Mining Society,CDMS)理事长,辅仁大学统计资讯学系教授,华通人商用信息有限公司高级顾问。中国人民大学应用统计科学研究中心学术委员会委员。
曹正凤;具有多年的JAVA程序设计和统计教学经验,人大经济论坛CDA金牌讲师,目前致力于大数据分析前沿领域研究,主持人大经济论坛基于hadoop架构的论坛主题推荐系统项目,参与《大数据背景下基于中国烟草消费需求的供给结构分析研究》、《基于数据整合的空气质量测度方法研究》等大数据项目。
辛立伟 ;Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精通Java企业级中间件技术设计、构建以及应用部署;畅销书《Java从初学到精通》(电子工业出版社,2010年6月)一书作者。多次参与大数据分析课程教学。
张田圆;软通动力信息技术(集团)有限公司助理副总裁、智慧业务事业群 CTO。分管技术领域:云计算、大数据、大规模并发系统、智慧城市及众创空间等。
董轶群;计算机软件与理论硕士,吉林大学计算机体系结构博士,具有多年的JAVA程序设计和操作系统教学经验,教学方式和方法新颖,深受学员的好评。研究方向为智能规划、空间推理、基于大数据的时空信息系统。
王安;钱方银通科技有限公司,首席分析师。中国科学技术大学理论力学学士,中国科学院计算力学硕士,北京大学光华管理学院MBA。此前曾带领团队为多家大中型银行,保险公司提供风险管理,数据分析咨询服务,关注领域包括,定量化风险管理,互联网金融,大数据应用。
我们的服务
关于免费重听: 在参加本期之后的后续三期可以(并且只能)选择一期免费来听。
报名流程
1.在线填写报名信息 http://www.peixun.net/view/336_join.html
2.给予反馈,确认报名信息
3.网上缴费
4.开课前一周发送电子版课件和教室路线图
提前一个月报名缴费学员立减500元
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09