数据分析师技术_数据分析技术_数据分析培训

两种SAS代码实现变量的缺失值频数及占比

两种SAS代码实现变量的缺失值频数及占比 sas对缺失值的统计，可得出缺失值的频数及占比。以下为详细程序代码： /*首先是创建示例数据集*/ data tmp; infile datalines delimiter=\",\"; length var1 $8.; lengt ...

2017-03-31

数据科学之—大数据知识体系大全

数据科学之—大数据知识体系大全 1、浅谈数据科学数据科学（Data Science）这一概念自大数据崛起也随之成为数据领域的讨论热点，从去年开始，“数据科学家”便成为了一个工作职位出现在各种招聘信息上。那 ...

2017-03-31

SAS正则式之prxsubstr 以及prxnext

SAS正则式之prxsubstr 以及prxnext 今天介绍的正则式中的prxsubstr函数以及prxnesth函数。这两个函数需要配合call使用，生成start以及length两个变量以供后面的使用。先介绍基本的参数。 Call prxsubtr( ...

2017-03-31

统计挖掘那些事：分层抽样与交叉验证

统计挖掘那些事：分层抽样与交叉验证 1留出法（Hold out）与分层抽样留出法的意思就是直接将总数据D划分为两个对立集合，训练集S以及测试集T，我们有S+T=D，以及S交T等于空集；举个简单例子说明， ...

2017-03-30

通过IMPORT过程读取外部文件数据

通过IMPORT过程读取外部文件数据通过IMPORT过程读取外部文件数据除了可以通过DATA步读取外部文本文件数据外，SAS还提供了IMPORT过程，通过它可以从外部数据源读取数据并写入到SAS数据集中。而且，如果使用 ...

2017-03-30

sas信用评分之变量筛选

sas信用评分之变量筛选今天介绍变量初步选择。这部分的内容我就只介绍information –value，我这次做的模型用的逻辑回归，后面会更新以基尼系数或者信息熵基础的筛选变量，期待我把。 Iv值的介绍你们已经很 ...

2017-03-30

如何在SAS EG中展示DB2表的中文列标识

如何在SAS EG中展示DB2表的中文列标识 SAS EG中展示DB2表的中文列标识 SAS用户经常会使用SAS Enterprise Guide （简称EG），通过SAS/ ACCESS to DB2 查看、获取DB2中的表。各种系统的开发人员经常使用神 ...

2017-03-30

访问关系型数据库系统中的数据

访问关系型数据库系统中的数据访问关系型数据库系统中的数据 SAS提供了一组访问关系型数据库的SAS/ACCESS接口，每种接口有单独的许可。使用这些接口，SAS可以和其他厂商数据库中的数据交互。SAS所支持的关 ...

2017-03-30

SAS程序错误及处理

SAS程序错误及处理通常我们所开发的SAS程序，很少在第一次提交时就能够运行完成并产生正确结果。程序越长越复杂，就越可能出现语法或逻辑错误。本文介绍了一些良好的SAS编程规范以减少程序错误，同时也描述了 ...

2017-03-30

SAS字符操作

SAS字符操作在sas数据清洗与整理过程会接触到两类型数据，字符型和数值型，并且sas只会以这两种形势出现。不会像R一样出现列表、数组、矩阵、数据框、日期等多种形势。Sas中关于数值型的操作大家并不陌生，所 ...

2017-03-29

SAS信用评分之逻辑回归的变量选择

SAS信用评分之逻辑回归的变量选择关于woe的转化，这一部在之前的这篇文章：sas批量输出变量woe值中已经写了，woe也只是简单的公式转化而已，所以在这系列中就不细究了哈。这次的文章我想来讲逻辑回归。你会说 ...

2017-03-29

SAS与R如何连接Oracle、DB2

SAS与R如何连接Oracle、DB2 职业是数据分析师，近2年给商业银行做数据分析和数据挖掘。在商业银行中，数据库多用Oracle和DB2，分析工具多使用SAS和R。如何将分析工具SAS、R与数据库Oracle、DB2建立连接，是数据 ...

2017-03-29

SAS分组合并数据

SAS分组合并数据昨天临睡前看到有人问我sas怎么分组并对数据进行合并，于是写了一个例子，希望对大家有所启发。合并前的数据集：合并后的数据集：主要是利用了retain语句，以下是代码： ...

2017-03-29

SAS SQL select…into语句创建宏变量巧妙解决问题的总结

SAS SQL select…into语句创建宏变量巧妙解决问题的总结今在某SAS交流群看到这样一个问题如下：有一个数据集a,有三个变量c,b,d(他们在数据集中的顺序也是如此)，想新建一个变量var，并添加到b和d中间，怎 ...

2017-03-29

优化算法—拟牛顿法之DFP算法

优化算法—拟牛顿法之DFP算法一、牛顿法在博文“优化算法——牛顿法(Newton Method)”中介绍了牛顿法的思路，牛顿法具有二阶收敛性，相比较最速下降法，收敛的速度更快。在牛顿法中使用到了函数的二阶导数 ...

2017-03-28

简单易学的机器学习算法—谱聚类(Spectal Clustering)

简单易学的机器学习算法—谱聚类(Spectal Clustering) 一、复杂网络中的一些基本概念 1、复杂网络的表示在复杂网络的表示中，复杂网络可以建模成一个图，其中，V表示网络中的节点的集合，E表示的是连 ...

2017-03-28

简单易学的机器学习算法—AdaBoost

简单易学的机器学习算法—AdaBoost 一、集成方法(Ensemble Method) 集成方法主要包括Bagging和Boosting两种方法，随机森林算法是基于Bagging思想的机器学习算法，在Bagging方法中，主要通过对训练数据集 ...

2017-03-28

$简单易学的机器学习算法—集成方法(Ensemble Method)$

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】OSM指标体系：自上而下拆解逻辑、搭建流 ...

【CDA干货】选择统计方法前最重要的核心工作：避免9 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

【CDA干货】问卷效度高与后续因子分析：逻辑关系、 ...

CDA持证人专访：唐一楠谈应届生数据分析就业与学习 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...