cda

全国校区

您的位置:首页 > CDA发布 > CDA LEVEL Ⅱ建模分析师_10月15日相约北京!

CDA LEVEL Ⅱ建模分析师_10月15日相约北京!

2015-09-07

CDA Level Ⅱ:建模分析师。两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。在政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。在Level Ⅰ的基础之上深入掌握高级多元统计方法,并且拓展时间序列分析和主要数据挖掘的理论知识与业界运用;能够熟练使用SAS、R、Matlab和SPSS中至少一个专业统计软件实现相关算法;熟悉使用SQL访问企业级数据库;具有按照数据挖掘标准流程进行项目需求分析、数据验证、建模与模型评估的能力。


CDA Level Ⅱ培训课程安排

背景介绍

CDA Level Ⅰ为基础薄弱的学员提供了入行的机会,能够结合业务完成基本的数据分析并作出数据报告。但企业想要在竞争激烈的市场中胜出,决策的速度和反应的效率尤为重要。根据调查显示,75%的企业在面临拟定策略时,常常无法获得实时且有根据的决策信息。什么样的数据、要通过什么样的方法,才能快速便捷的提供对决策有价值的信息,是现代企业所面临最迫切性的问题。因此,在CDA Level Ⅰ的基础上,CDA Level Ⅱ(建模分析师)即为企业决策提供及时有效、易实现、可信赖的数据支持。

在建模分析师中,数据挖掘(Data Mining)技术无疑是他们最强有力的核心竞争力。数据挖掘强调与现有信息系统的整合,以提供决策者做决策时所需的情报,或转化成经营智慧,以作为调整营运策略方针的辅助工具。以顾客关系管理(CRM)为例,数据挖掘是整个顾客关系管理的核心。其不但可以准确的定位目标市场,进行精准营销,还可以帮助业务人员了解客户深层需求,针对大量客户进行客制化,也就是所谓的一对一营销。本课程的目的就是要针对数据挖掘整套流程,根据CDA Level Ⅱ大纲标准,以金融、电信、电商和零售业为案例背景,结合SAS Enterprise Miner和SPSS Moderler深入讲授数据挖掘的主要算法。并将SAS语言和SQL进行有效的结合,讲授如何在实际工作中搭建数据挖掘环境,制定分类数据挖掘的标准流程,让学员胜任全方位的数据挖掘运用场景。

CDA LEVEL Ⅱ课程安排

项目名称
CDA Level Ⅱ建模分析师系统培训
时间

北京:2015年10月15-11月1日 八天 

上海:2015年11月19-12月6日 八天

地点

面授班:北京,人大经济论坛教室

面授班:上海,人民广场教室

远程班:在线同步直播
价格
面授:7400元
远程:5500元
优惠

1.     全日制学生及CDA LEVEL 老学员8折优惠(学生证证明文件)

2.     同一单位三人及以上报名9折优惠,五人及以上8折优惠

3.     CDA LEVEL 等级资格证书持有者立省1000元

4.     同时报名参加LEVEL和LEVEL Ⅱ享受8优惠。

点击查看LEVEL Ⅰ课程详情          以上优惠不可叠加!

证书认证
1.     可申请报考《CDA LEVEL 等级认证证书》(荐:含金量高)

2.     可申请工信部《数据分析师证书》,申请费用400元(培训后即可得到)

以上双证皆自愿申请

现场班福利
全套视频资料,终身学习,在线答疑

咖啡茶歇,论坛币(1000个)

学员对象:

1)各行业数据分析、数据挖掘从业者

2)金融、电信、零售、医学等各行业业务数据分析人员

3)政府事业单位大数据及数据挖掘项目人员

4)数据挖掘岗位就业、提拔涨薪、技能优化等从业人员

5)对数据挖掘感兴趣的各界人员


学员基础要求:

1)掌握CDA LEVEL Ⅰ大纲要求,CDA LEVEL Ⅰ详情:http://bbs.pinggu.org/thread-3419416-1-1.html

2)报名赠送《SAS初级视频》+《R语言数据挖掘视频》,提前观看视频做好预习工作。自行安装好SAS软件(带有EM模块),SPSS Modeler,MySQL及R软件。R软件的下载网址为"http://www.r-project.org/";MySQL的下载网址为"http://www.mysql.com/



课程收益

(1)了解什么是顾客关系管理;(2)了解顾客关系管理系统的架构及其组成元素;(3)了解如何利用顾客关系管理系统来进行营销活动;(4)了解什么是数据挖掘(Data Mining);(5)掌握数据挖掘技术的功能分类;(6)掌握数据挖掘技术的绩效增益;(7)了解数据挖掘技术的产业标准;(8)掌握如何利用数据挖掘技术来筛选关键变量(Key Attribute);(9)掌握如何利用数据挖掘技术来进行交叉销售(Cross-Selling);(10)掌握如何利用数据挖掘技术来评估客户的信用风险(Credit Risk); (11)了解如何利用数据挖掘技术来分析顾客行为、产生商业智慧并发展营销策略。(12)掌握如何使用数据挖掘工具SAS EM/SPSS Modeler来完成上述的各项工作。(13)掌握MySQL等主流数据库的使用。(14) 构建易实施的MySQL数据挖掘环境。(15)掌握构建信用打分卡的流程。


CDA Level Ⅱ培训课程大纲

详细大纲

时 程

大纲内容


第1天


主题:顾客关系管理及基础数据挖掘技术

企业使用之范围:

说明企业如何利用顾客关系管理来进行营销活动

理论介绍:

顾客关系管理系统的架构及其组成元素

企业如何利用顾客关系管理系统来进行营销活动

数据挖掘技术的功能分类

数据挖掘技术的绩效增益

数据挖掘技术的产业标准

数据挖掘基本观念与实际应用解说

SAS EM & SPSS Modeler实务案例操作:

Introduction to SAS Enterprise Miner(SAS EM) & IBM SPSS Modeler

Getting Started with SAS EM 12.1 & IBM SPSS Modeler 16

Creating a EM Project, Library and Diagram

Creating a SPSS Modeler Project


第1天

第2天


主题:基础数据挖掘技术

企业使用之范围:

说明企业如何利用数据前处理技术来进行数据的重整,建置数据仓库,以做为数据挖掘之输入

理论介绍:

数据挖掘技术的流程-SEMMA vs. CRISP DM

数据前处理(Data Preprocessing)技术

Attribute Selection(字段选择)

*Data Integration(数据整合)

Data Cleansing(数据清洗):

*Wrong Value(错误值),

*Outlier(离群值),

*Missing Value(遗失值)

Attribute Enrichment(字段扩充):

*内/外部数据的扩充方法

Data Coding(数据编码):

*Data Transformation(数据转换),

*Data Reduction(数据精简),

*Record Reduction(记录精简),

*Attribute Value Reduction(域值精简),

*Attribute Reduction(字段精简)

SAS EM & SPSS Modeler实务案例操作:

Defining a Data Source

Exploring a Data Source

  * Exploring Source Data

  * Changing the Explore Window Sampling Defaults

  * Modifying and Correcting Source Data

Managing Wrong Values/Outliers/Missing Values

Transforming Inputs

Recording Categorical Inputs


第2天

第3天


主题:进阶数据挖掘技术

企业使用之范围:

说明企业如何利用关键变量发掘技术来发掘对项目目标有效之关键变量,以做为数据挖掘之输入变量

理论介绍:

训练数据与测试数据的产生方法

关键变量(Key Attributes)发掘技术

*卡方检定(Chi-square Test)

*t检定及ANOVA检定(t Test & ANOVA Test)

*利用决策树(Decision Tree)选择关键变量

SAS EM & SPSS Modeler实务案例操作:

Creating Training & Validation Dataset

Variable Selection

Using Partial Least Squares for Input Selection

Using the Decision Tree for Input Selection


第3天


主题:进阶数据挖掘技术2

企业使用之范围:

说明如何利用分类技术之决策树来建立交叉销售(Cross-Selling)模型,以提升公司获利

理论介绍:

分类之决策树(Decision Tree)

SAS EM & SPSS Modeler实务案例操作:

Constructing a Decision Tree Model

Optimizing the Complexity of Decision Trees

Assessing a Decision Tree

Understanding Additional Plots & Tables

Automatic Tree Growth


第3天


主题:进阶数据挖掘技术3

企业使用之范围:

说明企业如何利用分类技术之神经网络支持向量机及分类多模型整合来建立信用评分(Credit Scoring)模型,以降低公司损失

理论介绍:

分类之神经网络(Neural Network)

分类之支持向量机(Support Vector Machine)

分类多模型整合(Ensemble)之装袋(Bagging)、增强(Boosting)学习

SAS EM &SPSS Modeler实务案例操作:

Training a Neural Network

Selecting Neural Network Inputs

Increasing Network Flexibility

Using the AutoNeural Tool

Constructing a Support Vector Machine

Constructing Ensemble Models by Using Bagging and Boosting Techniques

Model Comparisons


第4天


主题:进阶数据挖掘技术4

企业使用之范围:

说明企业如何利用模型评估技术来评估模型的优劣,以作为采用适当模型的准则

理论介绍:

模型评估(Model Assessment)技术

SAS EM & SPSS Modeler实务案例操作:

Model Fit Statistics:

* Comparing Models with Summary Statistics

Statistical Graph:

* Comparing Models with ROC Charts

* Comparing Models with Score Rankings Plots

* Adjusting for Separate Sampling

Profit Matrix:

* Evaluating Model Profit

* Viewing Additional Assessments

* Optimizing with Profit

Internally Scored Data Sets:

  * Creating a Score Data Source

  * Scoring with the Score Tool

  * Exporting a Scored Table

Score Code Modules:

  * Creating a SAS Score Code Module

  * Creating Other Score Code Modules


第4天


主题:进阶数据挖掘技术5

企业使用之范围:

说明企业如何利用预测(Prediction)技术之回归树及类神经网络来建立数值预测模型-如预测客户之年收入,以利公司设计营销活动

理论介绍:

回归树(Regression Tree)

神经网络(Neural Network)-非线性回归

SAS EM & SPSS Modeler实务案例操作:

Review and Set the Decision Tree Node

Review and Set the Neural Network Node


第4天


主题:进阶数据挖掘技术6

企业使用之范围:

说明企业如何利用关联及序列分析技术来建立交叉销售(Cross-Selling)及提升销售(Up-Selling)模型,以提升公司获利

理论介绍:

关联分析(Association Analysis)

序列分析(Sequence Analysis)

SAS EM & SPSS Modeler案例案例操作:

Consolidating Categorical Inputs

Market Basket Analysis

Sequence Analysis

第5天
















第6天

主题:SAS数据整理(涵盖SAS初级程序员知识)

上午: 
1、编程基础介绍 
1.1 课程介绍与认证体系介绍 
1.2 SAS 入门与基本语法 

2 、访问数据 
2.1 认识 SAS数据和逻辑库 
2.2 深入理解 SAS 数据类型

下午:
3、数据管理和操纵 
3.1 数据验证与清洗 
3.2 创建变量 
3.3 数据转换 
3.4 汇总数据 
3.5 数据循环处理 
3.6 合并 SAS数据集 
3.7 重组数据集 

主题:SAS编程进阶(涵盖SAS高级程序员知识)

上午: 
1、SQL过程
1.1 简单查询
1.2 汇总数据
1.3 横向连接表
1.4 子查询
1.5 集合操作
1.6 数据字典
1.7 Data MERGE语句与SQL区别


下午: 
2、SAS宏语言
2.1 宏编译器的运行机制
2.2 宏变量
2.3 通过Data和sql步创建宏变量
2.4 宏变量函数

    第7天

上午:
2.5 定义宏和定义宏参数
2.6 宏中的分支流程语句
2.7 宏中的循环流程语句

下午:
2.8 SQL和宏的信息交换
2.9 宏的运用实例及练习
3、程序优化
3.1 抽样方法
3.2 使用索引
3.3 去除重复值


第8天


主题:SAS数据挖掘建模(涵盖SAS商业数据分析师知识)

上午:
第1章:数据驱动的风险管理
第2章:信用卡违约预测模型案例流程

下午:
第3章:建模准备
第4章:变量粗筛
第5章:数据清洗
第6章:变量压缩与调整变量
第7章:预测类模型
第8章:模型评估
第9章:阀值设置
第10章:数据挖掘方法选择与数据挖掘的误区

主要操作案例:

1. 营销客户分群:ABC银行的营销部门想要针对该银行客户的使用行为,进行分群分析,以了解现行客户对本行的往来方式,并进一步提供适宜的营销接触模式。该银行从有效户(近三个月有交易者),取出10万笔样本数据。依下列四种交易管道进行客户分群分析:传统临柜交易(TBM)、自动柜员机交易(ATM)、银行专员服务(POS)、电话客服(CSC)。演练重点为极端值数据处理、分群变量选择、衍生变量产出、分群参数调整与分群结果解释。
2. 网站使用行为关联分析:ABC音乐广播电台为了服务更多听众,设置了电台网站,让更多的在线听众也可以透过网站服务以随时掌握电台的各个节目信息,网站提供了流行音乐趋势(music streams)、音乐下载(podcasts)、新闻讯息(news streams)、在线收听(live Web )以及历史节目收听(archives)等服务功能页面。分析人员想要藉由关联分析以进一步了解在线听众的使用行为,做为网站服务功能更新的依据。分析样本为捞取近两个月约150万笔的客户事务数据。分析目的为依据使用者网站事务数据,利用关联分析演算方法产生网站使用行为关联规则。演练重点为产生关联分析数据集、进行关联分析、关联分析结果解释。
3. XYZ银行的消费金融部门想了解既有的小额信贷客户的信用行为状况,建立一风险预测模型,藉以调整最适的授信政策、客户的信贷利率与信用额度,一达到风险管控,另一部分透过产品调整达到客户维护,与刺激信用额度动用。分析样本数据3000笔,坏客户比例16%。分析目的为依据可能影响违约之风险因子,利用判定树等分类演算方法建立信贷客户之风险预测模型。演练重点为数据浏览、遗失值处理、衍生变量产出、数据集分割(训练、验证、测试数据集)、预测模型变量筛选、判定树预测模型建置、判定树模型参数设定与模型解读、跨模型评估方法。
4. 捐款流失预测:某退除役军人协会过去内部的运作经费部份来自一般民众的捐款。协会多透过寄发会刊等出版品给一般民众,以获得民众对协会更多的了解与捐款。这次协会想要从过去对曾捐款的流失会员所做的活动响应纪录,来建立一个预测模型,并应用在未来对于捐款流失的会员中找到潜在仍会捐赠的名单,定期再提供给他们协会讯息或纪念小卡等。该协会目前约有350万名的捐款会员。针对流失会员的定义为近一到两年已无捐款者。本次的接触活动会针对预测分析所找出的名单,寄发贺卡。所取的样本数据为有响应与无响应者为1:1的过度抽样。真实母体数据的响应率为5%。

5. 信用风险模型。

次要操作案例:

1. 有机食品(Organic Product)营销案例
2. 人口普查数据集(Census Dataset)聚类案例
3. 牛仔裤商店(Jean Store)聚类分析案例
4. 银行客户购买金融商品(Financial Product)之关联分析(Association Analysis)案例
5. 文具(Stationery)及健康美容(Health & Beauty)用品之关联分析(Association Analysis)案例
6. 银行客户购买金融商品(Financial Product)之序列分析(Sequential Analysis)案例

讲师简介

李御玺,教授,国立台湾大学资讯工程博士,铭传大学资讯工程学系教授,铭传大学大数据研究中心主任,中华数据挖掘协会理事,云南财经大学信息学院客座教授,浙江大学城市学院客座教授,厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问,SAS-Taiwan顾问。在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。

服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 新竹国际商业银行(现已并入渣打银行)、第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、零售业如赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。


徐筱刚男,高级数据分析师,具有深厚的数理统计与应用数据分析专业背景,上海某金融机构数据分析部门高级DA,具有八年数据分析、数据挖掘的从业经验,曾就职零售企业、咨询公司等,独立或带团队完成零售、电信、金融等多个大型数据挖掘项目。


常国珍,曾为德勤管理咨询高级数据挖掘咨询顾问,SAS官方培训资深讲师,2014年SAS软件大赛判卷人,曾以数据挖掘工程师身份就职于亚信科技(中国)有限公司市场部。具有八年的数据挖掘实战经验,主攻分类模型,涉及客户精准营销、信用评估、价值提升、欺诈侦测和流失预警等数据挖掘主题,尤其熟悉银行个人客户精准营销的建模工作。

资格认证:SAS全球认证“Certified Statistical Business Analyst Using SAS 9 Regression and Modeling”、“Certified Advanced Programmer for SAS 9”。

报名咨询

电话:010-68454276

手机:


完 谢谢观看

分享
收藏

OK