CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

数据分析流程这么长,产品经理如何一人搞定?

数据分析流程这么长,产品经理如何一人搞定?
2016-05-05
数据分析流程这么长,产品经理如何一人搞定? 我2002年入行,那个时候还没有“产品经理”这个词,我的主要工作是为业务部门跑数据并且制作报表, 就是传说中“跑数据”、“做报表”的那个苦逼数据仓库工程师。 ...

R语言数据可视化之散点图

R语言数据可视化之散点图
2016-05-05
R语言数据可视化之散点图 散点图简介 散点图通常是用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本。 同时散点图中常常还会拟合一些直线,以用来表示某些模型。 绘制基本散 ...

R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)

R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)
2016-05-05
R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图) 数据分布图简介 中医上讲看病四诊法为:望闻问切。而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样;闻: ...

粗糙的贝叶斯转化概率预测模型

粗糙的贝叶斯转化概率预测模型
2016-05-05
粗糙的贝叶斯转化概率预测模型 转化率是网站分析中最受关注的指标之一,如何设定转化率目标?哪些用户最有可能转化?他们有哪些特征?如何发现并找到这些用户?这些都是负责网站运营和市场营销的同学最关注的问题。 ...

关联分析在游戏行业中应用案例

关联分析在游戏行业中应用案例
2016-05-04
关联分析在游戏行业中应用案例 背景:研究用户的历史付费行为,对付费用户购买的道具进行研究,发现道具之间的关联性,方便运营根据道具的关联性进行活动推广。 数据源:2016年3月28日——2016年4月4日一个 ...

常用数据分析方法论都有哪些?

常用数据分析方法论都有哪些?
2016-05-04
常用数据分析方法论都有哪些? 数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,它更多的是指数据分析思路,比如主要从哪几方面开展数据分析?各方面包含什么内容和指标? 数据分析方法论主要 ...

如何成为合格的数据分析师

如何成为合格的数据分析师
2016-05-04
如何成为合格的数据分析师 基本技术怎么强调都不过分。这里的术更多是(计算机、统计知识),多年做数据分析、数据挖掘的经历来看、以及业界朋友的交流来看,这点大家深有感触的。 数据库查询 ...

SAS如何连接oracle数据库?

SAS如何连接oracle数据库?
2016-05-04
SAS如何连接oracle数据库? 1.下载oracle客户端instantclient_11_2,不需要安装. 2.计算机->高级系统设置->修改环境变量 增加§NLS_LANG §变量值:SIMPLIFIED CHINESE_CHINA.ZHS16GBK 增加§ORACLE_H ...
ORACLE跨库查询复制表数据
2016-05-04
ORACLE跨库查询复制表数据 方法一: 在目前绝大部分数据库有分布式查询的需要。下面简单的介绍如何在oracle中配置实现跨库访问。 比如现在有2个数据库服务器,安装了2个数据库。数据库server A和B。现在 ...

k-means聚类”—数据分析、数据挖掘

k-means聚类”—数据分析、数据挖掘
2016-05-04
k-means聚类”—数据分析、数据挖掘 一、概要 分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处 ...

常见的数据科学家面试77个问题

常见的数据科学家面试77个问题
2016-05-04
常见的数据科学家面试77个问题 下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问题,供各位同行参考。 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。 2、告诉我二个分析或者计 ...

PROC REPORT基础

PROC REPORT基础
2016-05-04
PROC REPORT基础 1 PROC REPORT语法 PROC REPORTdata= SAS-data-setoptions ; COLUMNS variable_1 …. variable_n; DEFINE variable_1; DEFINE variable_2; . . . DEFINE variable_n; COM ...

大数据挖掘助力互联网金融风险控制

大数据挖掘助力互联网金融风险控制
2016-05-04
大数据挖掘助力互联网金融风险控制 互联网金融发展的关键是风险控制,“风险控制”已然成为诸多互联网金融企业能否长大的魔咒,这个不争的事实像一座大山摆在众多互联网金融大佬与创业者的面前。为什么阿里金融 ...

线性回归介绍之一

线性回归介绍之一
2016-05-04
线性回归介绍之一 线性回归在所有的统计方法中绝对占有不可忽视的一席之地,其用途之广泛毋庸置疑,更重要的是它是整个回归家族中最为简单、也最容易理解的方法,几乎所有的统计学教材,不管是医学统计还是 ...

随机森林(RF, RandomForest)介绍

随机森林(RF, RandomForest)介绍
2016-05-04
随机森林(RF, RandomForest)介绍 随机森林(RF, RandomForest)包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。通过自助法(boot-strap)重采样技术,不断生成训练样本和测试样本 ...

时间序列预测方法

时间序列预测方法
2016-05-04
时间序列预测方法 预测:是对尚未发生或目前还不明确的事物进行预先的估计和推测,是在现时对事物将要发生的结果进行探讨和研究,简单地说就是指从已知事件测定未知事件。 为什么要预测呢,因为预 ...

工具 | 一文学会R的基本绘图功能

工具 | 一文学会R的基本绘图功能
2016-04-28
现如今,ggplot特别火,这是因为:它是一个特别容易上手的R制图功能包。尽管如此,有时候我还是想用一些比ggplot更简洁的方法。这时候,我会选择用R里基本的绘图功能。基本款的图没有那么精致而且编程起来也有点奇怪 ...

机器学习和统计模型的差异

机器学习和统计模型的差异
2016-04-28
机器学习和统计模型的差异 在各种各样的数据科学论坛上这样一个问题经常被问到——机器学习和统计模型的差别是什么? 这确实是一个难以回答的问题。考虑到机器学习和统计模型解决问题的相似性,两者的区别 ...

一篇文章带你认识“高大上”的图数据挖掘

一篇文章带你认识“高大上”的图数据挖掘
2016-04-28
一篇文章带你认识“高大上”的图数据挖掘 互联网发展至今,数据规模越来越大,数据结构越来越复杂,而且对系统的需求越来越高。如果学习过数据结构,那么都知道图是放在最后一个结构,当你学习了图,那么应该感 ...
如何判断一笔交易是否属于欺诈?你只是需要一点数据挖掘
2016-04-28
如何判断一笔交易是否属于欺诈?你只是需要一点数据挖掘 如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否 ...

OK