CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

数据分析应该要避免的六个错误

数据分析应该要避免的六个错误
2016-05-21
数据分析应该要避免的六个错误 数据分析要产生真正的价值,或者说要让业务方,管理层感觉到真正的价值,其实需要非常多的东西: 1、要有数据,而且的确需要足够多的数据。是正常的数据积累。 2、分 ...
数据分析师做竞品分析的正确姿势
2016-05-21
数据分析师做竞品分析的正确姿势 市面上介绍怎么做竞品分析的文章多是以产品经理的视角进行,那么以数据分析师的视角做竞品分析该如何呢?以市场经理的视角做竞品分析又该如何呢?不同的身份视角,对应的是分析 ...

数据分析师:告诉你大数据的四大价值所在

数据分析师:告诉你大数据的四大价值所在
2016-05-20
数据分析师:告诉你大数据的四大价值所在 从事数据分析工作的人必须了解你使用的数据是怎么处理出来的,要了解数据库的结构和基本原理,同时如果条件充足的话,你还能有足够的能力从数据库里提取你需要的数据( ...

说说什么是数据分析方法论?

说说什么是数据分析方法论?
2016-05-20
说说什么是数据分析方法论? 在数据集成类的项目中,最难的过程就是数据分析了,数据分析过程位于数据集成类项目整个过程(前期准备调研—–数据分析—–接口实现)的第二步,它为第三步接口实现提供了充分的准 ...

数据分析的影响因素之分析算法

数据分析的影响因素之分析算法
2016-05-20
数据分析的影响因素之分析算法 整个数据分析的流程就是基于基础数据,通过不同的算法或数学模型来实现业务价值的过程。当我们拥有了数据基础后,下一步要做的就是选择合适的算法来挖掘隐藏在数据中的信息价值。 ...

大数据时代小数据分析

大数据时代小数据分析
2016-05-20
大数据时代小数据分析 大数据挖掘需要精通数据库、计算机编程和深厚的统计学基础,有的甚至要涉及运筹学范畴,是一门复合型的应用科学。大数据的案例现在着实是一抓一大把,比如国外典型的”啤酒与尿布”的案例 ...

说说什么是探索式数据分析、验证性数据分析

说说什么是探索式数据分析、验证性数据分析
2016-05-20
说说什么是探索式数据分析、验证性数据分析 在大数据时代,混乱的、无结构的、多媒体的海量数据,通过各种渠道源源不断地积累和记载着人类活动的各种痕迹。探索性数据分析可以成为了一个有效的工具。 美国约 ...

数据分析师与统计学

数据分析师与统计学
2016-05-20
数据分析师与统计学 1.数据分析师有三条腿,数据处理,统计分析,业务理解。 既然你是从业人员,那么你一定听过一句话,“数据挖掘有80%的时间花在了数据准备上”,当然,这80%的时间反而是最不能体现工作价 ...

工具 | 用Python做自然语言处理必知的八个工具

工具 | 用Python做自然语言处理必知的八个工具
2016-05-20
Python以其清晰简洁的语法、易用和可扩展性以及丰富庞大的库深受广大开发者喜爱。其内置的非常强大的机器学习代码库和数学库,使Python理所当然成为自然语言处理的开发利器。 那么使用Python进行自然语言处理,要是 ...

多重线性回归分析的四大纪律三项注意

多重线性回归分析的四大纪律三项注意
2016-05-19
多重线性回归分析的四大纪律三项注意 鉴于多重线性回归已经到了滥用的程度,特总结一下在使用线性回归时需要注意的问题,总结为四大纪律加三项注意。 四大纪律 四大纪律之一:自变量与因变量之间要存在线 ...

逻辑回归算法的原理及实现(LR)

逻辑回归算法的原理及实现(LR)
2016-05-19
逻辑回归算法的原理及实现(LR) 逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种。通过历史数据的表现对未来结果发生的概率进行预测。例如,我们可以将购买的概率设置为因变量 ...

Python常用技巧

Python常用技巧
2016-05-19
Python常用技巧 1. 获得当前文件路径 import os script_dir = os.path.abspath(os.path.dirname(__file__)) 在hadoop中获得输入文件的地址: os.path.dirname(os.environ[\"map_input_file\"]) ...

小白入手数据分析的思维模式

小白入手数据分析的思维模式
2016-05-19
小白入手数据分析的思维模式 数据分析(Data Analysis)——这个词真的是如雷贯耳,装B一绝啊!甭管什么玩意,上来先整一通再说。“数据分析”甚是被提上了神坛,找工作或者聊点行业内的动态不提点数据简直是没法 ...
R数据分析进阶之plyr
2016-05-19
R数据分析进阶之plyr 本讲义只考虑基于数据框的操作,所指函数是ddply 基本思想 plyr包数据打理模型是”分割-应用-结合“,这个跟大数据Map/Redcue计算模型极为相似,大概的关系是分割-应用,对应Map,结 ...

数据挖掘之决策树分类

数据挖掘之决策树分类
2016-05-19
数据挖掘之决策树分类 1. 理论知识 决策树分类算法的一般流程如下:一开始,所有的实例均位于根节点,所有参数的取值均离散化;根据启发规则选择一个参数,根据参数取值的不同对实例集进行分割; ...
商业地产调研如何筹备?怎样执行?数据如何分析
2016-05-18
商业地产调研如何筹备?怎样执行?数据如何分析 商业地产市场调研筹备工作   在调研之前的筹备工作中,有7个需要注意的关键点。   1、分析调研目标   调研筹备工作的第一个关键点是分析调研目标,很多人 ...
数据分析应该要避免的6个问题
2016-05-18
数据分析应该要避免的6个问题 数据分析要产生真正的价值,或者说要让业务方,管理层感觉到真正的价值,其实需要非常多的东西: 1、要有数据,而且的确需要足够多的数据。是正常的数据积累。 2、分析师能 ...

R语言与分类算法的绩效评估

R语言与分类算法的绩效评估
2016-05-18
R语言与分类算法的绩效评估 关于分类算法我们之前也讨论过了KNN、决策树、naivebayes、SVM、ANN、logistic回归。关于这么多的分类算法,我们自然需要考虑谁的表现更加的优秀。 既然要对分类算法进行评价,那 ...

spss二分类的logistic回归的操作和分析方法

spss二分类的logistic回归的操作和分析方法
2016-05-18
spss二分类的logistic回归的操作和分析方法 二分类指的是因变量的数据只有两个值,代表事物的两种类别,典型的二分类变量如性别、是否患病等。因变量为二分变量原则上是无法做回归的,在回归方程中的因变量实 ...

spss中如何处理极端值、错误值

spss中如何处理极端值、错误值
2016-05-18
spss中如何处理极端值、错误值 spss中录入数据以后,第一步不是去分析数据,而是要检验数据是不是有录入错误的,是不是有不合常理的数据,今天我们要做一个描述性统计,进而查看哪些数据是不合理的。下面是具 ...

OK