机器理解大数据的秘密:聚类算法深度详解 在理解大数据方面,聚类是一种很常用的基本方法。近日,数据科学家兼程序员 Peter Gleeson 在 freeCodeCamp 发布了一篇深度讲解文章,对一些聚类算法进行了基础介绍, ...
2017-04-03SAS数组的使用 今天呢本想写个基于信息增益的决策树算法,突然发现把数组的使用方法给忘记了,那今天借介绍下SAS中数组的使用吧。 SAS把一组同为数值型或同为字符型的变量合在一起,使用同一个名字称呼 ...
2017-04-03sas输出基尼方差,F检验 有时候,我们在建模前期会有一个变量探索的单变量与因变量的数据分析报告,但其实,不同的数据形式有不同的指标来衡量变量与因变量的解释能力 今天的代码介绍的就是单变量与因变量之 ...
2017-04-03关于缺失统计函数cmiss、nmiss中的小细节 在数据清理中统计缺失变量的缺失的时候,我们经常会用到cmiss函数和nmiss函数,这两者都是用来对缺失个数进行统计,两者区别就在于前者既能用于数值型也能用于字符型, ...
2017-04-03sas正则式之prxparse. Prxmatch 今天分享的是我这几天用到的正则式的一个小总结,这部分的内容因为比较多,所以会分成几篇文章分享。 其实我们在做数据的过程中老是会听到别人说,r处理数据比sas好用,但是 ...
2017-04-03sas正则式之prxparen 今天还是要继续正则式的内容,这周的内容是prxparen函数,这个函数我个人觉得特别有用,是因为他和“|”结合使用可以同时容纳很多种情况的字符串。 prxparse这个函数没有什么参数,就 ...
2017-04-03SAS DATA步之全解密 SAS DATA步对于SAS入门学习者来说是个难以理解的东西,因为SAS封装了一些过程,这种封装对于有语言基础的人来说反而是一个障碍。本文非常详细的解释了SAS 数据的编译、执行过程,对于了解SA ...
2017-04-03SAS—format过程 format过程主要用来定义数值或符号文字的输出和输入格式。接下来看一个例子: /*format 过程定义了变量类型 income_desc*/ proc format ; value income_desc 0-<5000 = \'低收入\' ...
2017-04-02这十个经典方法,是运营数据分析不能不会的 眼花缭乱的东西很多,真正派上用场的,却不见得是那些看起来炫酷的。很多方法朴实无华,却解决大量的问题。下面十个方法都是我这么多年做互联网运营分析时一定会用 ...
2017-04-02SAS—freq、means过程 SAS—freq、means过程 proc means过程 means过程是SAS提供的一个数据汇总过程,单个或多个变量的简单的描述性统计分析。 means过程语法: proc means <data = 数据集名><选项> ...
2017-04-02优秀数据分析团队应该做好这些事情 Q:数据分析团队如何给自己找活干? 当业务部门没有提出分析想法,各方面数据看板已经做得很完善的情况下。数据分析团队如何给自己找活干,面对那么多业务部门,如何从一个 ...
2017-04-02SAS信用评分九步曲之第一步数据清洗 累积了一段时间的建模经验了,这次想把我在建模中用的代码分批分享出来,可能写的东西不是你能用到的,毕竟我们接触到的数据都不一样。但是譬如文本清洗之类的,看我之前的 ...
2017-04-02SAS编程中的这些小问题你遇到过吗 在用SAS编程时,总是时不时会遇到各种各样的小问题,我本人也遇到过一些有意思的问题,在写程序的过程中,为了避免这些小问题也慢慢的积累了一些经验,那么通过这一节分享给大 ...
2017-04-02从模型选择到超参调整,六步教你如何为机器学习项目选择算法 随着机器学习的进一步火热,越来越多的算法已经可以用在许多任务的执行上,并且表现出色。 但是动手之前到底哪个算法可以解决我们特定的实际问 ...
2017-04-01SAS一些有用的语句 今天本想继续介绍 summary过程的,但是发现别人整理的比我更好,于是周末再更,好好整理一下描述性统计分析及评分卡建模,今天给大家介绍一些sas有用的语句吧。 1.如果在同一程序 ...
2017-04-01SAS运算符IN在宏语句中的应用 作为一名SAS程序员,我想大家对运算符IN并不陌生,它广泛的应用于数据步或SQL条件语句中,进行条件判断或数据筛选。请看下面的示例代码: 今天我们想给大家介绍的是如何在 ...
2017-04-01留一交叉验证及SAS代码 在数据量很少,用什么模型?我们总结过当数据量很少时如何选择模型和方法,以使得数据能够最大限度的得到利用。 其中有一个方法就是做交叉验证。 我有备选的模型G(x1, x2, x3), G ...
2017-04-01【新手必备】SAS常用函数整理 本文根据网络资源对SAS的常用函数进行了整理。主要内容包括: 1. 数学函数 2. 数组函数 3. 字符函数 4. 日期和时间函数 5. 分布密度函数,分布函数 6. 分位数函 ...
2017-04-01SAS—基于熵的连续变量的离散化 今天介绍下整个程序逻辑及sas代码的详细介绍。 首先宏 %BinContVard调用了宏%CandSplits;然后宏%CandSplits又调用宏 %BestSplit、%GValue;最后通过宏%ApplyMap应用于数 ...
2017-03-31sas单变量的特征分析 大炮,我有个烦恼,我领导最近老叫我单变量结合因变量分析,但是都是分段分析,我总是写proc sql然后group by ,但是这个过程好无聊啊,有木有什么新的代码,让我可以分析的快点啊。 最 ...
2017-03-31Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04