机器理解大数据的秘密:聚类算法深度详解 在理解大数据方面,聚类是一种很常用的基本方法。近日,数据科学家兼程序员 Peter Gleeson 在 freeCodeCamp 发布了一篇深度讲解文章,对一些聚类算法进行了基础介绍, ...
2017-04-03
SAS数组的使用 今天呢本想写个基于信息增益的决策树算法,突然发现把数组的使用方法给忘记了,那今天借介绍下SAS中数组的使用吧。 SAS把一组同为数值型或同为字符型的变量合在一起,使用同一个名字称呼 ...
2017-04-03
sas输出基尼方差,F检验 有时候,我们在建模前期会有一个变量探索的单变量与因变量的数据分析报告,但其实,不同的数据形式有不同的指标来衡量变量与因变量的解释能力 今天的代码介绍的就是单变量与因变量之 ...
2017-04-03
关于缺失统计函数cmiss、nmiss中的小细节 在数据清理中统计缺失变量的缺失的时候,我们经常会用到cmiss函数和nmiss函数,这两者都是用来对缺失个数进行统计,两者区别就在于前者既能用于数值型也能用于字符型, ...
2017-04-03
sas正则式之prxparse. Prxmatch 今天分享的是我这几天用到的正则式的一个小总结,这部分的内容因为比较多,所以会分成几篇文章分享。 其实我们在做数据的过程中老是会听到别人说,r处理数据比sas好用,但是 ...
2017-04-03
sas正则式之prxparen 今天还是要继续正则式的内容,这周的内容是prxparen函数,这个函数我个人觉得特别有用,是因为他和“|”结合使用可以同时容纳很多种情况的字符串。 prxparse这个函数没有什么参数,就 ...
2017-04-03
SAS DATA步之全解密 SAS DATA步对于SAS入门学习者来说是个难以理解的东西,因为SAS封装了一些过程,这种封装对于有语言基础的人来说反而是一个障碍。本文非常详细的解释了SAS 数据的编译、执行过程,对于了解SA ...
2017-04-03
SAS—format过程 format过程主要用来定义数值或符号文字的输出和输入格式。接下来看一个例子: /*format 过程定义了变量类型 income_desc*/ proc format ; value income_desc 0-<5000 = \'低收入\' ...
2017-04-02
这十个经典方法,是运营数据分析不能不会的 眼花缭乱的东西很多,真正派上用场的,却不见得是那些看起来炫酷的。很多方法朴实无华,却解决大量的问题。下面十个方法都是我这么多年做互联网运营分析时一定会用 ...
2017-04-02
SAS—freq、means过程 SAS—freq、means过程 proc means过程 means过程是SAS提供的一个数据汇总过程,单个或多个变量的简单的描述性统计分析。 means过程语法: proc means <data = 数据集名><选项> ...
2017-04-02优秀数据分析团队应该做好这些事情 Q:数据分析团队如何给自己找活干? 当业务部门没有提出分析想法,各方面数据看板已经做得很完善的情况下。数据分析团队如何给自己找活干,面对那么多业务部门,如何从一个 ...
2017-04-02SAS信用评分九步曲之第一步数据清洗 累积了一段时间的建模经验了,这次想把我在建模中用的代码分批分享出来,可能写的东西不是你能用到的,毕竟我们接触到的数据都不一样。但是譬如文本清洗之类的,看我之前的 ...
2017-04-02
SAS编程中的这些小问题你遇到过吗 在用SAS编程时,总是时不时会遇到各种各样的小问题,我本人也遇到过一些有意思的问题,在写程序的过程中,为了避免这些小问题也慢慢的积累了一些经验,那么通过这一节分享给大 ...
2017-04-02
从模型选择到超参调整,六步教你如何为机器学习项目选择算法 随着机器学习的进一步火热,越来越多的算法已经可以用在许多任务的执行上,并且表现出色。 但是动手之前到底哪个算法可以解决我们特定的实际问 ...
2017-04-01
SAS一些有用的语句 今天本想继续介绍 summary过程的,但是发现别人整理的比我更好,于是周末再更,好好整理一下描述性统计分析及评分卡建模,今天给大家介绍一些sas有用的语句吧。 1.如果在同一程序 ...
2017-04-01
SAS运算符IN在宏语句中的应用 作为一名SAS程序员,我想大家对运算符IN并不陌生,它广泛的应用于数据步或SQL条件语句中,进行条件判断或数据筛选。请看下面的示例代码: 今天我们想给大家介绍的是如何在 ...
2017-04-01
留一交叉验证及SAS代码 在数据量很少,用什么模型?我们总结过当数据量很少时如何选择模型和方法,以使得数据能够最大限度的得到利用。 其中有一个方法就是做交叉验证。 我有备选的模型G(x1, x2, x3), G ...
2017-04-01【新手必备】SAS常用函数整理 本文根据网络资源对SAS的常用函数进行了整理。主要内容包括: 1. 数学函数 2. 数组函数 3. 字符函数 4. 日期和时间函数 5. 分布密度函数,分布函数 6. 分位数函 ...
2017-04-01
SAS—基于熵的连续变量的离散化 今天介绍下整个程序逻辑及sas代码的详细介绍。 首先宏 %BinContVard调用了宏%CandSplits;然后宏%CandSplits又调用宏 %BestSplit、%GValue;最后通过宏%ApplyMap应用于数 ...
2017-03-31
sas单变量的特征分析 大炮,我有个烦恼,我领导最近老叫我单变量结合因变量分析,但是都是分段分析,我总是写proc sql然后group by ,但是这个过程好无聊啊,有木有什么新的代码,让我可以分析的快点啊。 最 ...
2017-03-31在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03