数据分析师技术_数据分析技术_数据分析培训

简单易学的机器学习算法—SVD奇异值分解

简单易学的机器学习算法—SVD奇异值分解一、SVD奇异值分解的定义假设M是一个的矩阵，如果存在一个分解：其中的酉矩阵，的半正定对角矩阵，的共轭转置矩阵，且为的酉矩阵。这样的分解称为M的奇异值分解，对 ...

2017-03-24

简单易学的机器学习算法—线性回归(2)

简单易学的机器学习算法—线性回归(2) 一、基本线性回归模型的抽象在基本的线性回归中(可见简单易学的机器学习算法—线性回归(1))，对于一个线性回归为题，我们得到一个线性方程组：在上一篇中我们是构建平 ...

2017-03-24

简单易学的机器学习算法—线性回归(1)

简单易学的机器学习算法—线性回归(1) 一、线性回归的概念对连续型数据做出预测属于回归问题。举个简单的例子：例如我们在知道房屋面积(HouseArea)和卧室的数量(Bedrooms)的情况下要求房屋的价格(Price)。通 ...

2017-03-24

数据分析产品的下一个进化:基于无埋点的有埋点

数据分析产品的下一个进化:基于无埋点的有埋点一直以来，人们把大数据和埋点技术紧紧捆绑在一起，大数据时代也被称为埋点时代。技术发展，更新更快的无埋点技术横空出世。那么埋点技术是不是就此被判了死刑， ...

2017-03-24

优化算法—人工蜂群算法(ABC)

优化算法—人工蜂群算法(ABC) 一、人工蜂群算法的介绍人工蜂群算法(Artificial Bee Colony, ABC)是由Karaboga于2005年提出的一种新颖的基于群智能的全局优化算法，其直观背景来源于蜂群的采蜜行为，蜜蜂根据 ...

2017-03-23

简单易学的机器学习算法—K-Means算法

简单易学的机器学习算法—K-Means算法一、聚类算法的简介聚类算法是一种典型的无监督学习算法，主要用于将相似的样本自动归到一个类别中。聚类算法与分类算法最大的区别是：聚类算法是无监督的学习算法，而 ...

2017-03-23

简单易学的机器学习算法—Logistic回归

简单易学的机器学习算法—Logistic回归一、Logistic回归的概述 Logistic回归是一种简单的分类算法，提到“回归”，很多人可能觉得与分类没什么关系，Logistic回归通过对数据分类边界的拟合来实现分类。而“回 ...

2017-03-23

简单易学的机器学习算法—朴素贝叶斯

简单易学的机器学习算法—朴素贝叶斯一、贝叶斯定理 1、条件概率条件概率是指在事件B发生的情况下，事件A发生的概率，用表示。 2、全概率公式含义是：如果和构成样本空间 ...

2017-03-23

数据分析技术：事后多重比较的方法介绍；了解各种方法的原理才能做到“准确分析”

数据分析技术：事后多重比较的方法介绍；了解各种方法的原理才能做到“准确分析” 基础准备均值比较的假设检验是数据分析最重要的分析内容之一，根据参与比较的样本数量不同，使用的假设检验方法也不同，做 ...

2017-03-23

简单易学的机器学习算法—极限学习机(ELM)

简单易学的机器学习算法—极限学习机(ELM) 一、极限学习机的概念极限学习机(Extreme Learning Machine) ELM，是由黄广斌提出来的求解单隐层神经网络的算法。 ELM最大的特点是对于传统的神经网络，尤其是单隐 ...

2017-03-23

简单易学的机器学习算法—决策树之ID3算法

简单易学的机器学习算法—决策树之ID3算法一、决策树分类算法概述决策树算法是从数据的属性（或者特征）出发，以属性作为基础，划分不同的类。例如对于如下数据集（数据集）其中，第一列和第二列为属性（ ...

2017-03-22

简单易学的机器学习算法—神经网络之BP神经网络

简单易学的机器学习算法—神经网络之BP神经网络一、BP神经网络的概念 BP神经网络是一种多层的前馈神经网络，其主要的特点是：信号是前向传播的，而误差是反向传播的。具体来说，对于如下的只含一个隐层的神经 ...

2017-03-22

简单易学的机器学习算法—分类回归树CART

简单易学的机器学习算法—分类回归树CART 分类回归树（Classification and Regression Tree，CART）是一种典型的决策树算法，CART算法不仅可以应用于分类问题，而且可以用于回归问题。一、树回归的概念对于 ...

2017-03-22

优化算法—粒子群算法(PSO)

优化算法—粒子群算法(PSO) 一、粒子群算法的概述粒子群算法(PSO)属于群智能算法的一种，是通过模拟鸟群捕食行为设计的。假设区域里就只有一块食物（即通常优化问题中所讲的最优解），鸟群的任务是找到这个食 ...

2017-03-22

数据结构和算法—用动态规划求解最短路径问题

数据结构和算法—用动态规划求解最短路径问题在利用动态规划求解的过程中值得注意的就是是否包含最优子结构，简单来讲就是一个问题的最优解是不是包含着子问题的最优解。利用求解子问题的最优解最后得到整个问 ...

2017-03-22

数据结构和算法—动态规划

数据结构和算法—动态规划我一直最想做的就是机器学习，所以也都是在报机器学习的岗位，在BAT三家公司中，其实还是要讲百度吧，因为阿里在一面的时候就挂了，给我的理由是我投错了岗位(据面试官讲我应该去投算 ...

2017-03-22

简单易学的机器学习算法—Rosenblatt感知机的对偶解法

简单易学的机器学习算法—Rosenblatt感知机的对偶解法一、Rosenblatt感知机回顾在博文“简单易学的机器学习算法——Rosenblatt感知机”中介绍了Rosenblatt感知机的基本概念。Rosenblatt感知机是针对线性可分 ...

2017-03-21

简单易学的机器学习算法—基于密度的聚类算法DBSCAN

简单易学的机器学习算法—基于密度的聚类算法DBSCAN 一、基于密度的聚类算法的概述我想了解下基于密度的聚类算法，熟悉下基于密度的聚类算法与基于距离的聚类算法，如K-Means算法之间的区别。基于密度的 ...

2017-03-21

论文中的机器学习算法——基于密度峰值的聚类算法

论文中的机器学习算法——基于密度峰值的聚类算法下面还是主要来谈谈论文的主要思想。算法的主要思想思想在聚类算法中主要有这样几种：划分的方法，如K-Means 层次的方 ...

2017-03-21

简单易学的机器学习算法—非线性支持向量机

简单易学的机器学习算法—非线性支持向量机一、回顾介绍了支持向量机的基本概念，线性可分支持向量机的原理以及线性支持向量机的原理，线性可分支持向量机是线性支持向量机的基础。对于线性支持向量机，选择 ...

2017-03-21

CDA考试动态

CDA报考指南

热门栏目

最新资讯

CDA数据分析师认证介绍

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...