CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

对应分析方法与对应图解读方法-—七种分析角度

对应分析方法与对应图解读方法-—七种分析角度
2017-03-13
对应分析方法与对应图解读方法-—七种分析角度 对应分析是一种多元统计分析技术,主要分析定性数据Category Data方法,也是强有力的数据图示化技术,当然也是强有力的市场研究分析技术。 这里主要介绍大 ...

均值、方差、标准差及协方差、协方差矩阵详解

均值、方差、标准差及协方差、协方差矩阵详解
2017-03-12
均值、方差、标准差及协方差、协方差矩阵详解 一、统计学基本概念:均值、方差、标准差 统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式 ...

主成分分析(PCA)特征选择算法详解

主成分分析(PCA)特征选择算法详解
2017-03-12
主成分分析(PCA)特征选择算法详解 1. 问题 真实的训练数据总是存在各种各样的问题: 1、 比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征,显 ...

线性回归与梯度下降算法

线性回归与梯度下降算法
2017-03-12
线性回归与梯度下降算法 1.1线性回归 在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为 ...

机器学习基础—梯度下降法(Gradient Descent)

机器学习基础—梯度下降法(Gradient Descent)
2017-03-12
机器学习基础—梯度下降法(Gradient Descent) 梯度下降法。一开始只是对其做了下简单的了解。随着内容的深入,发现梯度下降法在很多算法中都用的到,除了之前看到的用来处理线性模型,还有BP神经网络等。于是 ...

机器学习:决策树(Decision Tree)

机器学习:决策树(Decision Tree)
2017-03-11
机器学习:决策树(Decision Tree) 决策树(decision tree)是一种基本的分类与回归方法。在分类问题中,它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。在学习时,利 ...

机器学习中的降维算法:ISOMAP & MDS

机器学习中的降维算法:ISOMAP & MDS
2017-03-11
机器学习中的降维算法:ISOMAP & MDS 降维是机器学习中很有意思的一部分,很多时候它是无监督的,能够更好地刻画数据,对模型效果提升也有帮助,同时在数据可视化中也有着举足轻重的作用。 一说到降维,大家第 ...

机器学习算法常用指标总结

机器学习算法常用指标总结
2017-03-11
机器学习算法常用指标总结 考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被 预测成正类,即为真正类(True positive), ...

【机器学习经典算法源码分析系列】-- 线性回归

【机器学习经典算法源码分析系列】-- 线性回归
2017-03-11
【机器学习经典算法源码分析系列】-- 线性回归 一、单变量线性回归: 1.数据集可视化 2.求解模型参数 对于线性回归模型,有两种方法可以求解模型参数。 1) 梯度下降法 将代价函数代入展开: Matlab代码实 ...

机器学习中特征选择概述

机器学习中特征选择概述
2017-03-11
机器学习中特征选择概述 1. 背景 1.1 问题 在机器学习的实际应用中,特征数量可能较多,其中可能存在不相关的特征,特征之间也可能存在相关性,容易导致如下的后果: (1) 特征个数越多,分析特征、训练 ...

机器学习入门:K-近邻算法

机器学习入门:K-近邻算法
2017-03-11
机器学习入门:K-近邻算法 先来一个简单的例子,我们如何来区分动作类电影与爱情类电影呢?动作片中存在很多的打斗镜头,爱情片中可能更多的是亲吻镜头,所以我们姑且通过这两种镜头的数量来预测这部电影的主题 ...

SPSS中如何进行分列

SPSS中如何进行分列
2017-03-10
SPSS中如何进行分列 首先,只要是字符型的都要新生成一个字符串的变量(这里就生成的是c变量,a5表示这列字符的长度为5,科根据需要设置,程序如下: string c (a5). 其次根据需要用到substr函数,先看看 ...

数据分析和个人提升

数据分析和个人提升
2017-03-10
数据分析和个人提升 数据分析,从工作技能的角度,除了业务直接相关的,也有相对比较通用的环节或技能单元,例如前面提到的目标确认、数据分解、归纳比较等,此外有时候还会涉及到最优化、数据图形化以及关系数 ...

4大分析维度,快速解锁App用户数据分析

4大分析维度,快速解锁App用户数据分析
2017-03-10
4大分析维度,快速解锁App用户数据分析 在APP运营过程中,会衍生出大量的数据,通过数据分析提取有用的信息,能更好地把控APP的运营态势,并进一步指导APP运营。 APP数据来源比较广泛,但总的来说可归纳为两 ...

简单的利用“切片器”进行数据分析

简单的利用“切片器”进行数据分析
2017-03-10
简单的利用“切片器”进行数据分析 切片器』是2010版本开始新加的功能,通过切片器可以更好的进行数据筛选,更直观的展示给他人。 ps:要是用切片器进行数据分析,必须是格式化后的数据或透视表数据,否则无 ...

数据分析报告的7个基本步骤

数据分析报告的7个基本步骤
2017-03-10
数据分析报告的7个基本步骤 一、为什么要做一份数据报告 你是一个在校学生,上着自己喜欢或不喜欢的课,闲来无事,你打开知乎,看到了数据分析话题,你下定决心要成为一个数据分析师,你搞来一堆学习资料和 ...

2017年数据分析的十大趋势解读

2017年数据分析的十大趋势解读
2017-03-10
2017年数据分析的十大趋势解读 1.可视化 可视化会向整个信息产业链发展,不再仅仅限于数据分析了,而且新技术的出现,也将会加速发展。 2.规模车向组合发展 语文学的进步把大数据焦点从规模转向组合式 ...

企业用户如何玩转大数据,赢在未来

企业用户如何玩转大数据,赢在未来
2017-03-09
企业用户如何玩转大数据,赢在未来 传统的数据治理在大数据时代面临着大量数据的接入、大量数据的存储和快速灵活处理的三方面问题,这一期我们来聊聊如何正确的思考和解决这三个问题。 大量数据接入 大量 ...

浅谈以史为鉴与数据分析应用

浅谈以史为鉴与数据分析应用
2017-03-09
浅谈以史为鉴与数据分析应用 数据本身就离不开历史,人们总是利用来自于历史的客观数据,进行不断的分析和总结,并以此尽可能的预测未来,作为下一步行动和决策的依据,可以说是“以史为鉴”。 当然了,在没 ...

关联规则推荐算法的原理及实现

关联规则推荐算法的原理及实现
2017-03-09
关联规则推荐算法的原理及实现 关联规则用来发现数据间潜在的关联,最典型的应用是电商网站的购物车分析。本文将通过一个简单的例子来说明关联规则中各个术语的含义以及具体的计算方法。 这是一些用户的购物 ...

OK