cda

数字化人才认证

数据分析师技术_数据分析技术_数据分析培训_第187页-CDA数据分析师官网

首页 > 技术干货

8个经过证实的方法:提高机器学习模型的准确率

8个经过证实的方法:提高机器学习模型的准确率
2016-05-05
8个经过证实的方法:提高机器学习模型的准确率 提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题,那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法,但模型正确率并没有改 ...

scikit-learn的线性回归模型

scikit-learn的线性回归模型
2016-05-05
scikit-learn的线性回归模型 特征选择的方法 作为有监督学习,分类问题是预测类别结果,而回归问题是预测一个连续的结果。 1. 使用pandas来读取数据 Panda ...

你应该掌握的七种回归技术

你应该掌握的七种回归技术
2016-05-05
你应该掌握的七种回归技术 回归分析是建模和分析数据的重要工具。本文解释了回归分析的内涵及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回归等七种 ...

数据挖掘算法基础-关联规则

数据挖掘算法基础-关联规则
2016-05-05
数据挖掘算法基础-关联规则 数据挖掘中,被常拿来说的啤酒尿布的例子就是一个很典型的运用关联算法来做购物来分析的例子。常被用于交易数据、关系数据的分析,发现数据集中隐藏的频繁模式,这些频繁模式可以用 ...

数据融合的六个基本步骤

数据融合的六个基本步骤
2016-05-05
数据融合的六个基本步骤 数据融合:大数据分析的瓶颈 数据处理新工具使数据科学家从数据准备的繁琐工作中解放出来,但如何根据每个数据分析项目量体定制,融合多源数据以形成有效的分析数据集仍是数据科学家 ...

大数据数据库技术简介与分类分析

大数据数据库技术简介与分类分析
2016-05-05
大数据数据库技术简介与分类分析 说起大数据生态,不得不提大数据生态系统图,而大数据行业却不断的发生着巨变,目前的这张图应该还算比较新了。 创业者们蜂拥至这个行业,这个行业正变得越来越拥挤。H ...

数据分析流程这么长,产品经理如何一人搞定?

数据分析流程这么长,产品经理如何一人搞定?
2016-05-05
数据分析流程这么长,产品经理如何一人搞定? 我2002年入行,那个时候还没有“产品经理”这个词,我的主要工作是为业务部门跑数据并且制作报表, 就是传说中“跑数据”、“做报表”的那个苦逼数据仓库工程师。 ...

R语言数据可视化之散点图

R语言数据可视化之散点图
2016-05-05
R语言数据可视化之散点图 散点图简介 散点图通常是用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本。 同时散点图中常常还会拟合一些直线,以用来表示某些模型。 绘制基本散 ...

R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)

R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)
2016-05-05
R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图) 数据分布图简介 中医上讲看病四诊法为:望闻问切。而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样;闻: ...

粗糙的贝叶斯转化概率预测模型

粗糙的贝叶斯转化概率预测模型
2016-05-05
粗糙的贝叶斯转化概率预测模型 转化率是网站分析中最受关注的指标之一,如何设定转化率目标?哪些用户最有可能转化?他们有哪些特征?如何发现并找到这些用户?这些都是负责网站运营和市场营销的同学最关注的问题。 ...

关联分析在游戏行业中应用案例

关联分析在游戏行业中应用案例
2016-05-04
关联分析在游戏行业中应用案例 背景:研究用户的历史付费行为,对付费用户购买的道具进行研究,发现道具之间的关联性,方便运营根据道具的关联性进行活动推广。 数据源:2016年3月28日——2016年4月4日一个 ...

常用数据分析方法论都有哪些?

常用数据分析方法论都有哪些?
2016-05-04
常用数据分析方法论都有哪些? 数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,它更多的是指数据分析思路,比如主要从哪几方面开展数据分析?各方面包含什么内容和指标? 数据分析方法论主要 ...

如何成为合格的数据分析师

如何成为合格的数据分析师
2016-05-04
如何成为合格的数据分析师 基本技术怎么强调都不过分。这里的术更多是(计算机、统计知识),多年做数据分析、数据挖掘的经历来看、以及业界朋友的交流来看,这点大家深有感触的。 数据库查询 ...

SAS如何连接oracle数据库?

SAS如何连接oracle数据库?
2016-05-04
SAS如何连接oracle数据库? 1.下载oracle客户端instantclient_11_2,不需要安装. 2.计算机->高级系统设置->修改环境变量 增加§NLS_LANG §变量值:SIMPLIFIED CHINESE_CHINA.ZHS16GBK 增加§ORACLE_H ...
ORACLE跨库查询复制表数据
2016-05-04
ORACLE跨库查询复制表数据 方法一: 在目前绝大部分数据库有分布式查询的需要。下面简单的介绍如何在oracle中配置实现跨库访问。 比如现在有2个数据库服务器,安装了2个数据库。数据库server A和B。现在 ...

k-means聚类”—数据分析、数据挖掘

k-means聚类”—数据分析、数据挖掘
2016-05-04
k-means聚类”—数据分析、数据挖掘 一、概要 分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处 ...

常见的数据科学家面试77个问题

常见的数据科学家面试77个问题
2016-05-04
常见的数据科学家面试77个问题 下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问题,供各位同行参考。 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。 2、告诉我二个分析或者计 ...

PROC REPORT基础

PROC REPORT基础
2016-05-04
PROC REPORT基础 1 PROC REPORT语法 PROC REPORTdata= SAS-data-setoptions ; COLUMNS variable_1 …. variable_n; DEFINE variable_1; DEFINE variable_2; . . . DEFINE variable_n; COM ...

线性回归介绍之一

线性回归介绍之一
2016-05-04
线性回归介绍之一 线性回归在所有的统计方法中绝对占有不可忽视的一席之地,其用途之广泛毋庸置疑,更重要的是它是整个回归家族中最为简单、也最容易理解的方法,几乎所有的统计学教材,不管是医学统计还是 ...

随机森林(RF, RandomForest)介绍

随机森林(RF, RandomForest)介绍
2016-05-04
随机森林(RF, RandomForest)介绍 随机森林(RF, RandomForest)包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。通过自助法(boot-strap)重采样技术,不断生成训练样本和测试样本 ...

OK