CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

机器学习算法与Python实践之(二)支持向量机(SVM)初级

机器学习算法与Python实践之(二)支持向量机(SVM)初级
2017-03-26
机器学习算法与Python实践之(二)支持向量机(SVM)初级 一、引入 支持向量机(SupportVector Machines),这个名字可是响当当的,在机器学习或者模式识别领域可是无人不知,无人不晓啊。八九十年代的时候 ...

机器学习算法与Python实践之(一)k近邻(KNN)

机器学习算法与Python实践之(一)k近邻(KNN)
2017-03-26
机器学习算法与Python实践之(一)k近邻(KNN) 一、kNN算法分析 K最近邻(k-Nearest Neighbor,KNN)分类算法可以说是最简单的机器学习算法了。它采用测量不同特征值之间的距离方法进行分类。它的思想很简 ...

简单易学的机器学习算法—马尔可夫链蒙特卡罗方法MCMC

简单易学的机器学习算法—马尔可夫链蒙特卡罗方法MCMC
2017-03-26
简单易学的机器学习算法—马尔可夫链蒙特卡罗方法MCMC 对于一般的分布的采样,在很多的编程语言中都有实现,如最基本的满足均匀分布的随机数,但是对于复杂的分布,要想对其采样,却没有实现好的函数,在这里, ...

Python基础—网络编程

Python基础—网络编程
2017-03-26
Python基础—网络编程 在网络编程中主要是使用Socket(套接字)进行编程,套接字相当于应用程序访问下层网络的服务的接口,使用Socket可以是得不同主机之间进行通信,从而实现数据交换。 1、Socket工作方式 套 ...

python—时间与时间戳之间的转换

python—时间与时间戳之间的转换
2017-03-25
python—时间与时间戳之间的转换 对于时间数据,如2016-05-05 20:28:54,有时需要与时间戳进行相互的运算,此时就需要对两种形式进行转换,在Python中,转换时需要用到time模块,具体的操作有如下的几种: 将 ...

简单易学的机器学习算法—Mean Shift聚类算法

简单易学的机器学习算法—Mean Shift聚类算法
2017-03-25
简单易学的机器学习算法—Mean Shift聚类算法 一、Mean Shift算法概述 Mean Shift算法,又称为均值漂移算法,Mean Shift的概念最早是由Fukunage在1975年提出的,在后来由Yizong Cheng对其进行扩充,主要提出 ...

《数学之美》拾遗—潜在语义索引(LSI)

《数学之美》拾遗—潜在语义索引(LSI)
2017-03-25
《数学之美》拾遗—潜在语义索引(LSI) 一、潜在语义索引的提出 潜在语义索引(LSI),又称为潜在语义分析(LSA),是在信息检索领域提出来的一个概念。主要是在解决两类问题,一类是一词多义,如“bank”一词 ...

《数学之美》拾遗—TF-IDF

《数学之美》拾遗—TF-IDF
2017-03-25
《数学之美》拾遗—TF-IDF 在学习机器学习的过程中,我写了简单易学的机器学习算法的专题,依然还有很多的算法会陆续写出来。网上已经有很多人分享过类似的材料,我只是通过自己的理解,想尽可能用一种通俗易懂 ...

简单易学的机器学习算法——协同过滤推荐算法(2)

简单易学的机器学习算法——协同过滤推荐算法(2)
2017-03-25
简单易学的机器学习算法——协同过滤推荐算法(2) 一、基于协同过滤的推荐系统 协同过滤(Collaborative Filtering)的推荐系统的原理是通过将用户和其他用户的数据进行比对来实现推荐的。比对的具体方法就是通过 ...

简单易学的机器学习算法—协同过滤推荐算法(1)

简单易学的机器学习算法—协同过滤推荐算法(1)
2017-03-25
简单易学的机器学习算法—协同过滤推荐算法(1) 一、推荐系统的概念 推荐系统(Recommendation System, RS),简单来说就是根据用户的日常行为,自动预测用户的喜好,为用户提供更多完善的服务。举个简单的例子, ...

简单易学的机器学习算法—主成分分析(PCA)

简单易学的机器学习算法—主成分分析(PCA)
2017-03-24
简单易学的机器学习算法—主成分分析(PCA) 一、数据降维 对于现在维数比较多的数据,我们首先需要做的就是对其进行降维操作。降维,简单来说就是说在尽量保证数据本质的前提下将数据中的维数降低。降维的操作 ...

简单易学的机器学习算法—岭回归(Ridge Regression)

简单易学的机器学习算法—岭回归(Ridge Regression)
2017-03-24
简单易学的机器学习算法—岭回归(Ridge Regression) 一、一般线性回归遇到的问题 在处理复杂的数据的回归问题时,普通的线性回归会遇到一些问题,主要表现在: 预测精度:这里要处理好这样一对为题,即样本的 ...

简单易学的机器学习算法—SVD奇异值分解

简单易学的机器学习算法—SVD奇异值分解
2017-03-24
简单易学的机器学习算法—SVD奇异值分解 一、SVD奇异值分解的定义 假设M是一个的矩阵,如果存在一个分解: 其中的酉矩阵,的半正定对角矩阵,的共轭转置矩阵,且为的酉矩阵。这样的分解称为M的奇异值分解,对 ...

简单易学的机器学习算法—线性回归(2)

简单易学的机器学习算法—线性回归(2)
2017-03-24
简单易学的机器学习算法—线性回归(2) 一、基本线性回归模型的抽象 在基本的线性回归中(可见简单易学的机器学习算法—线性回归(1)),对于一个线性回归为题,我们得到一个线性方程组: 在上一篇中我们是构建平 ...

简单易学的机器学习算法—线性回归(1)

简单易学的机器学习算法—线性回归(1)
2017-03-24
简单易学的机器学习算法—线性回归(1) 一、线性回归的概念 对连续型数据做出预测属于回归问题。举个简单的例子:例如我们在知道房屋面积(HouseArea)和卧室的数量(Bedrooms)的情况下要求房屋的价格(Price)。通 ...

数据分析产品的下一个进化:基于无埋点的有埋点

数据分析产品的下一个进化:基于无埋点的有埋点
2017-03-24
数据分析产品的下一个进化:基于无埋点的有埋点 一直以来,人们把大数据和埋点技术紧紧捆绑在一起,大数据时代也被称为埋点时代。技术发展,更新更快的无埋点技术横空出世。那么埋点技术是不是就此被判了死刑, ...

优化算法—人工蜂群算法(ABC)

优化算法—人工蜂群算法(ABC)
2017-03-23
优化算法—人工蜂群算法(ABC) 一、人工蜂群算法的介绍 人工蜂群算法(Artificial Bee Colony, ABC)是由Karaboga于2005年提出的一种新颖的基于群智能的全局优化算法,其直观背景来源于蜂群的采蜜行为,蜜蜂根据 ...

简单易学的机器学习算法—K-Means算法

简单易学的机器学习算法—K-Means算法
2017-03-23
简单易学的机器学习算法—K-Means算法 一、聚类算法的简介 聚类算法是一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。聚类算法与分类算法最大的区别是:聚类算法是无监督的学习算法,而 ...

简单易学的机器学习算法—Logistic回归

简单易学的机器学习算法—Logistic回归
2017-03-23
简单易学的机器学习算法—Logistic回归 一、Logistic回归的概述 Logistic回归是一种简单的分类算法,提到“回归”,很多人可能觉得与分类没什么关系,Logistic回归通过对数据分类边界的拟合来实现分类。而“回 ...

简单易学的机器学习算法—朴素贝叶斯

简单易学的机器学习算法—朴素贝叶斯
2017-03-23
简单易学的机器学习算法—朴素贝叶斯 一、贝叶斯定理 1、条件概率 条件概率是指在事件B发生的情况下,事件A发生的概率,用表示。 2、全概率公式 含义是:如果和构成样本空间 ...

OK