京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA Level Ⅱ:建模分析师。两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。在政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。在Level Ⅰ的基础之上深入掌握高级多元统计方法,并且拓展时间序列分析和主要数据挖掘的理论知识与业界运用;能够熟练使用SAS、R、Matlab和SPSS中至少一个专业统计软件实现相关算法;熟悉使用SQL访问企业级数据库;具有按照数据挖掘标准流程进行项目需求分析、数据验证、建模与模型评估的能力。
CDA Level Ⅱ培训课程安排
背景介绍
CDA Level Ⅰ为基础薄弱的学员提供了入行的机会,能够结合业务完成基本的数据分析并作出数据报告。但企业想要在竞争激烈的市场中胜出,决策的速度和反应的效率尤为重要。根据调查显示,75%的企业在面临拟定策略时,常常无法获得实时且有根据的决策信息。什么样的数据、要通过什么样的方法,才能快速便捷的提供对决策有价值的信息,是现代企业所面临最迫切性的问题。因此,在CDA Level Ⅰ的基础上,CDA Level Ⅱ(建模分析师)即为企业决策提供及时有效、易实现、可信赖的数据支持。
在建模分析师中,数据挖掘(Data Mining)技术无疑是他们最强有力的核心竞争力。数据挖掘强调与现有信息系统的整合,以提供决策者做决策时所需的情报,或转化成经营智慧,以作为调整营运策略方针的辅助工具。以顾客关系管理(CRM)为例,数据挖掘是整个顾客关系管理的核心。其不但可以准确的定位目标市场,进行精准营销,还可以帮助业务人员了解客户深层需求,针对大量客户进行客制化,也就是所谓的一对一营销。本课程的目的就是要针对数据挖掘整套流程,根据CDA Level Ⅱ大纲标准,以金融、电信、电商和零售业为案例背景,结合SAS Enterprise Miner和SPSS Moderler深入讲授数据挖掘的主要算法。并将Python语言和SQL进行有效的结合,讲授如何在实际工作中搭建数据挖掘环境,制定分类数据挖掘的标准流程,让学员胜任全方位的数据挖掘运用场景。
CDA LEVEL Ⅱ课程安排
|
项目名称 |
CDA Level Ⅱ建模分析师系统培训 |
| 时间 |
北京:2015年4月23-26日,5月1-2日 六天
|
| 地点 |
面授班:北京,人大经济论坛教室 面授班:上海,人民广场教室 远程班:在线同步直播 |
| 价格 |
面授:5900元
远程:4400元
|
| 优惠 |
1. 全日制学生及CDA LEVEL Ⅰ老学员8折优惠(学生证证明文件) 2. 同一单位三人及以上报名9折优惠,五人及以上8折优惠 3. CDA LEVEL Ⅰ等级资格证书持有者立省1000元 4. 同时报名参加LEVELⅠ和LEVEL Ⅱ享受8折优惠。 点击查看LEVEL Ⅰ课程详情 以上优惠不可叠加! |
| 证书认证 |
1. 可申请报考《CDA LEVEL Ⅱ等级认证证书》(荐:含金量高)
2. 可申请工信部《数据分析师证书》,申请费用400元(培训后即可得到) 以上双证皆自愿申请 |
| 现场班福利 |
全套视频资料,终身学习,在线答疑
午餐,咖啡茶歇,论坛币(1000个) |
学员对象:
1)各行业数据分析、数据挖掘从业者
2)金融、电信、零售、医学等各行业业务数据分析人员
3)政府事业单位大数据及数据挖掘项目人员
4)数据挖掘岗位就业、提拔涨薪、技能优化等从业人员
5)对数据挖掘感兴趣的各界人员
学员基础要求:
1)掌握CDA LEVEL Ⅰ大纲要求,CDA LEVEL Ⅰ详情:http://bbs.pinggu.org/thread-3419416-1-1.html
2)报名赠送《SAS初级视频》+《R语言及数据挖掘视频》,提前观看视频做好预习工作。自行安装好SAS软件(带有EM模块),SPSS Modeler,MySQL及R软件。R软件的下载网址为"http://www.r-project.org/";MySQL的下载网址为"http://www.mysql.com/。
课程收益
(1)了解什么是顾客关系管理;(2)了解顾客关系管理系统的架构及其组成元素;(3)了解如何利用顾客关系管理系统来进行营销活动;(4)了解什么是数据挖掘(Data Mining);(5)掌握数据挖掘技术的功能分类;(6)掌握数据挖掘技术的绩效增益;(7)了解数据挖掘技术的产业标准;(8)掌握如何利用数据挖掘技术来筛选关键变量(Key Attribute);(9)掌握如何利用数据挖掘技术来进行交叉销售(Cross-Selling);(10)掌握如何利用数据挖掘技术来评估客户的信用风险(Credit Risk); (11)了解如何利用数据挖掘技术来分析顾客行为、产生商业智慧并发展营销策略。(12)掌握如何使用数据挖掘工具SAS EM/SPSS Modeler/Python来完成上述的各项工作。(13)掌握MySQL等主流数据库的使用。(14) 构建易实施的MySQL和Python数据挖掘环境。(15)掌握构建信用打分卡的流程和Python语言脚本。
CDA Level Ⅱ培训课程大纲
详细大纲
|
时 程 |
大纲内容 |
|
第1天 |
主题:顾客关系管理及基础数据挖掘技术 |
|
企业使用之范围: 说明企业如何利用顾客关系管理来进行营销活动 |
|
|
理论介绍: 顾客关系管理系统的架构及其组成元素 企业如何利用顾客关系管理系统来进行营销活动 数据挖掘技术的功能分类 数据挖掘技术的绩效增益 数据挖掘技术的产业标准 数据挖掘基本观念与实际应用解说 |
|
|
SAS EM & SPSS Modeler实务案例操作: Introduction to SAS Enterprise Miner(SAS EM) & IBM SPSS Modeler Getting Started with SAS EM 12.1 & IBM SPSS Modeler 16 Creating a EM Project, Library and Diagram Creating a SPSS Modeler Project |
|
|
第1天 第2天 |
主题:基础数据挖掘技术 |
|
企业使用之范围: |
|
|
理论介绍: 数据挖掘技术的流程-SEMMA vs. CRISP DM 数据前处理(Data Preprocessing)技术 Attribute Selection(字段选择) *Data Integration(数据整合) Data Cleansing(数据清洗): *Wrong Value(错误值), *Outlier(离群值), *Missing Value(遗失值) Attribute Enrichment(字段扩充): *内/外部数据的扩充方法 Data Coding(数据编码): *Data Transformation(数据转换), *Data Reduction(数据精简), *Record Reduction(记录精简), *Attribute Value Reduction(域值精简), *Attribute Reduction(字段精简) |
|
|
SAS EM & SPSS Modeler实务案例操作: Defining a Data Source Exploring a Data Source * Exploring Source Data * Changing the Explore Window Sampling Defaults * Modifying and Correcting Source Data Managing Wrong Values/Outliers/Missing Values Transforming Inputs Recording Categorical Inputs |
|
|
第2天 第3天 |
主题:进阶数据挖掘技术 |
|
企业使用之范围: 说明企业如何利用关键变量发掘技术来发掘对项目目标有效之关键变量,以做为数据挖掘之输入变量 |
|
|
理论介绍: 训练数据与测试数据的产生方法 关键变量(Key Attributes)发掘技术 *卡方检定(Chi-square Test) *t检定及ANOVA检定(t Test & ANOVA Test) *利用决策树(Decision Tree)选择关键变量 |
|
|
SAS EM & SPSS Modeler实务案例操作: Creating Training & Validation Dataset Variable Selection Using Partial Least Squares for Input Selection Using the Decision Tree for Input Selection |
|
|
第3天 |
主题:进阶数据挖掘技术2 |
|
企业使用之范围: 说明如何利用分类技术之决策树来建立交叉销售(Cross-Selling)模型,以提升公司获利 |
|
|
理论介绍: 分类之决策树(Decision Tree) |
|
|
SAS EM & SPSS Modeler实务案例操作: Constructing a Decision Tree Model Optimizing the Complexity of Decision Trees Assessing a Decision Tree Understanding Additional Plots & Tables Automatic Tree Growth |
|
|
第3天 |
主题:进阶数据挖掘技术3 |
|
企业使用之范围: 说明企业如何利用分类技术之神经网络、支持向量机及分类多模型整合来建立信用评分(Credit Scoring)模型,以降低公司损失 |
|
|
理论介绍: 分类之神经网络(Neural Network) 分类之支持向量机(Support Vector Machine) 分类多模型整合(Ensemble)之装袋(Bagging)、增强(Boosting)学习 |
|
|
SAS EM &SPSS Modeler实务案例操作: Training a Neural Network Selecting Neural Network Inputs Increasing Network Flexibility Using the AutoNeural Tool Constructing a Support Vector Machine Constructing Ensemble Models by Using Bagging and Boosting Techniques Model Comparisons |
|
|
第4天 |
主题:进阶数据挖掘技术4 |
|
企业使用之范围: 说明企业如何利用模型评估技术来评估模型的优劣,以作为采用适当模型的准则 |
|
|
理论介绍: 模型评估(Model Assessment)技术 |
|
|
SAS EM & SPSS Modeler实务案例操作: Model Fit Statistics: * Comparing Models with Summary Statistics Statistical Graph: * Comparing Models with ROC Charts * Comparing Models with Score Rankings Plots * Adjusting for Separate Sampling Profit Matrix: * Evaluating Model Profit * Viewing Additional Assessments * Optimizing with Profit Internally Scored Data Sets: * Creating a Score Data Source * Scoring with the Score Tool * Exporting a Scored Table Score Code Modules: * Creating a SAS Score Code Module * Creating Other Score Code Modules |
|
|
第4天 |
主题:进阶数据挖掘技术5 |
|
企业使用之范围: 说明企业如何利用预测(Prediction)技术之回归树及类神经网络来建立数值预测模型-如预测客户之年收入,以利公司设计营销活动 |
|
|
理论介绍: 回归树(Regression Tree) |
|
|
SAS EM & SPSS Modeler实务案例操作: Review and Set the Decision Tree Node Review and Set the Neural Network Node |
|
|
第4天 |
主题:进阶数据挖掘技术6 |
|
企业使用之范围: 说明企业如何利用关联及序列分析技术来建立交叉销售(Cross-Selling)及提升销售(Up-Selling)模型,以提升公司获利 |
|
|
理论介绍: 关联分析(Association Analysis) 序列分析(Sequence Analysis) |
|
|
SAS EM & SPSS Modeler案例案例操作: Consolidating Categorical Inputs Market Basket Analysis Sequence Analysis |
|
|
第5天 |
环境搭建与数据转换
|
|
主体:数据分析环境搭建 1、Python程序安装 2、MySQL数据库安装、配置、建库;
|
|
|
主题:Python与其它软件之间数据转换 1、Python内部的数据存储类型 2、Python与CSV格式文件; 3、Python与EXCEL格式文件; 4、Python与MySQL; 5、Python与ODBC;
|
|
|
主题:用R作统计 两变量相关检验(两样本T检验、方差分析、卡方检验、相关检验); 主成分与因子分析; |
|
|
|
数据挖据完整流程案例 ——Python编程构造银行信用风险模型 |
|
第6天 |
主题:信用风险建模简介 银行信用风险监管体系与信用风险内部模型 主题:单变量检验与数据清洗 缺失值检验与处理方法 异常值检验与处理方法 解释变量粗筛 双变量关系检验法 数据分箱 |
|
主题:连续变量压缩技术 变量聚类 分类变量压缩技术 似完整分类数据问题 WOE方法 主题:逻辑回归建模技术 模型选择:逐步法、全子集法 根据经验Logit曲线进行连续变量转换 主题:编程模型评估技术 ROC曲线 K-S曲线 |
李御玺,教授,国立台湾大学资讯工程博士,铭传大学资讯工程学系教授,铭传大学大数据研究中心主任,中华数据挖掘协会理事,云南财经大学信息学院客座教授,浙江大学城市学院客座教授,厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问,SAS-Taiwan顾问。在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。
服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 新竹国际商业银行(现已并入渣打银行)、第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、零售业如赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。
常国珍,曾为德勤管理咨询高级数据挖掘咨询顾问,SAS官方培训资深讲师,2014年SAS软件大赛判卷人,曾以数据挖掘工程师身份就职于亚信科技(中国)有限公司市场部。具有八年的数据挖掘实战经验,主攻分类模型,涉及客户精准营销、信用评估、价值提升、欺诈侦测和流失预警等数据挖掘主题,尤其熟悉银行个人客户精准营销的建模工作。
资格认证:SAS全球认证“Certified Statistical Business Analyst Using SAS 9 Regression and Modeling”、“Certified Advanced Programmer for SAS 9”。参与项目:1、某国有大型银行企业级模型试验室建设; 2、某国有大型银行企业级欺诈系统建设;3、某股份制大型银行信用卡部产品精准营销建模和行为信用评级模型优化工作; 4、某股份制大型银行零售业务部客户忠诚度提升项目。
CDA数据分析师LEVEL Ⅱ资格证书
(此证书为CDA协会颁发,人大经济论坛国内主办,全国统考,一年两次,此证书为CDA数据分析师唯一认证证书,可以作为企业事业单位选拔和聘用专业人才的任职参考依据。)
CDA考试安排:
1. 考试时间2015年6月28日
2. 考试内容:CDA LEVLE Ⅱ建模分析师大纲。
3. 报名费用:1500元/人。参加CDA系统培训学员费用为1000/人。
4. 其他:CDA考试一次不过可申请补考,补考费用为原价一半。证书3年审核一次。
5. 报考链接:http://cda.pinggu.org/cda_exam.html
国家工信部数据分析师证书
此证书参加CDA培训后随堂考试,通过即可获得,证书申请费用为400元。(可自愿申请)
报名流程
1.在线填写报名信息
2.给予反馈,确认报名信息
3.网上缴费
4.开课前一周发送电子版课件和教室路线图
微博关注:@CDA数据分析师_人大经济论坛
QQ交流群:274123859
微信订阅:CDA数据分析师

数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26表格结构数据以“行存样本、列储属性”的规范形态,成为CDA数据分析师最核心的工作载体。从零售门店的销售明细表到电商平台的用 ...
2025-11-26在pandas数据处理工作流中,“列标签”(Column Labels)是连接数据与操作的核心桥梁——它不仅是DataFrame数据结构的“索引标识 ...
2025-11-25Anaconda作为数据科学领域的“瑞士军刀”,集成了Python解释器、conda包管理工具及海量科学计算库,是科研人员、开发者的必备工 ...
2025-11-25