CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

大数据分析:数据分析师到底是个怎样的物种!

大数据分析:数据分析师到底是个怎样的物种!
2016-05-06
大数据分析:数据分析师到底是个怎样的物种! 不管数据分析师是个什么物种,不可否认,在大数据时代,人们对理性的数据分析结果越来越感兴趣,企业CEO、营销人员都在渴求数据,数据分析师的市场会越来越大,这个 ...

怎样才能正确利用数据来抓住目标用户?

怎样才能正确利用数据来抓住目标用户?
2016-05-06
怎样才能正确利用数据来抓住目标用户? 运营人员通常比较关心的一个问题是:用什么样的方法来重新获取已经流失的用户?今天我们来谈谈有哪些关键的指导策略,怎样才能正确利用数据来抓住你的目标用户? ...

从最大似然到EM算法浅解

从最大似然到EM算法浅解
2016-05-05
从最大似然到EM算法浅解 机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人 ...
经验 | 同时拿到阿里,网易游戏,腾讯,smartx的offer的过程
2016-05-05
前言 从今年的3月14日阿里的电话面试开始,到现在4月16日在西安悦豪酒店进行的腾讯HR面到现在一个多月了,中间先后收到了阿里,网易游戏,腾讯和smartx的offer,今天早晨刚刚接到了腾讯HR的电话,下午发offer,现在 ...

机器学习算法需要注意的一些问题

机器学习算法需要注意的一些问题
2016-05-05
机器学习算法需要注意的一些问题 对于机器学习的实际运用,光停留在知道了解的层面还不够,我们需要对实际中容易遇到的一些问题进行深入的挖掘理解。我打算将一些琐碎的知识点做一个整理。 1 数据不平衡问 ...

8个经过证实的方法:提高机器学习模型的准确率

8个经过证实的方法:提高机器学习模型的准确率
2016-05-05
8个经过证实的方法:提高机器学习模型的准确率 提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题,那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法,但模型正确率并没有改 ...

scikit-learn的线性回归模型

scikit-learn的线性回归模型
2016-05-05
scikit-learn的线性回归模型 特征选择的方法 作为有监督学习,分类问题是预测类别结果,而回归问题是预测一个连续的结果。 1. 使用pandas来读取数据 Panda ...

你应该掌握的七种回归技术

你应该掌握的七种回归技术
2016-05-05
你应该掌握的七种回归技术 回归分析是建模和分析数据的重要工具。本文解释了回归分析的内涵及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回归等七种 ...

数据挖掘算法基础-关联规则

数据挖掘算法基础-关联规则
2016-05-05
数据挖掘算法基础-关联规则 数据挖掘中,被常拿来说的啤酒尿布的例子就是一个很典型的运用关联算法来做购物来分析的例子。常被用于交易数据、关系数据的分析,发现数据集中隐藏的频繁模式,这些频繁模式可以用 ...

数据融合的六个基本步骤

数据融合的六个基本步骤
2016-05-05
数据融合的六个基本步骤 数据融合:大数据分析的瓶颈 数据处理新工具使数据科学家从数据准备的繁琐工作中解放出来,但如何根据每个数据分析项目量体定制,融合多源数据以形成有效的分析数据集仍是数据科学家 ...

大数据数据库技术简介与分类分析

大数据数据库技术简介与分类分析
2016-05-05
大数据数据库技术简介与分类分析 说起大数据生态,不得不提大数据生态系统图,而大数据行业却不断的发生着巨变,目前的这张图应该还算比较新了。 创业者们蜂拥至这个行业,这个行业正变得越来越拥挤。H ...

数据分析流程这么长,产品经理如何一人搞定?

数据分析流程这么长,产品经理如何一人搞定?
2016-05-05
数据分析流程这么长,产品经理如何一人搞定? 我2002年入行,那个时候还没有“产品经理”这个词,我的主要工作是为业务部门跑数据并且制作报表, 就是传说中“跑数据”、“做报表”的那个苦逼数据仓库工程师。 ...

R语言数据可视化之散点图

R语言数据可视化之散点图
2016-05-05
R语言数据可视化之散点图 散点图简介 散点图通常是用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本。 同时散点图中常常还会拟合一些直线,以用来表示某些模型。 绘制基本散 ...

R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)

R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)
2016-05-05
R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图) 数据分布图简介 中医上讲看病四诊法为:望闻问切。而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样;闻: ...

粗糙的贝叶斯转化概率预测模型

粗糙的贝叶斯转化概率预测模型
2016-05-05
粗糙的贝叶斯转化概率预测模型 转化率是网站分析中最受关注的指标之一,如何设定转化率目标?哪些用户最有可能转化?他们有哪些特征?如何发现并找到这些用户?这些都是负责网站运营和市场营销的同学最关注的问题。 ...

关联分析在游戏行业中应用案例

关联分析在游戏行业中应用案例
2016-05-04
关联分析在游戏行业中应用案例 背景:研究用户的历史付费行为,对付费用户购买的道具进行研究,发现道具之间的关联性,方便运营根据道具的关联性进行活动推广。 数据源:2016年3月28日——2016年4月4日一个 ...

常用数据分析方法论都有哪些?

常用数据分析方法论都有哪些?
2016-05-04
常用数据分析方法论都有哪些? 数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,它更多的是指数据分析思路,比如主要从哪几方面开展数据分析?各方面包含什么内容和指标? 数据分析方法论主要 ...

如何成为合格的数据分析师

如何成为合格的数据分析师
2016-05-04
如何成为合格的数据分析师 基本技术怎么强调都不过分。这里的术更多是(计算机、统计知识),多年做数据分析、数据挖掘的经历来看、以及业界朋友的交流来看,这点大家深有感触的。 数据库查询 ...

SAS如何连接oracle数据库?

SAS如何连接oracle数据库?
2016-05-04
SAS如何连接oracle数据库? 1.下载oracle客户端instantclient_11_2,不需要安装. 2.计算机->高级系统设置->修改环境变量 增加§NLS_LANG §变量值:SIMPLIFIED CHINESE_CHINA.ZHS16GBK 增加§ORACLE_H ...
ORACLE跨库查询复制表数据
2016-05-04
ORACLE跨库查询复制表数据 方法一: 在目前绝大部分数据库有分布式查询的需要。下面简单的介绍如何在oracle中配置实现跨库访问。 比如现在有2个数据库服务器,安装了2个数据库。数据库server A和B。现在 ...

OK