cda

数字化人才认证

首页 > 行业图谱 >

常见机器学习算法比较

常见机器学习算法比较
2016-07-11
常见机器学习算法比较 机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择 ...

数据挖掘工程师笔试及答案整理

数据挖掘工程师笔试及答案整理
2021-02-03
数据挖掘工程师笔试及答案整理 2013百度校园招聘数据挖掘工程师 《数据分析专项练习题库》 《CDA数据分析认证考试模拟题库》 《企业数据分析面试题库》 一、简答题(30分) 1、简述数据 ...

R实现多元线性回归分析!

R实现多元线性回归分析!
2016-06-20
R中的线性回归函数比较简单,就是lm(),比较复杂的是对线性模型的诊断和调整。这里结合Statistical Learning和杜克大学的Data Analysis and Statistical Inference的章节以及《R语言实战》的OLS(Ordinary Least Squa ...

机器学习实践中应避免的7种常见错误

机器学习实践中应避免的7种常见错误
2016-06-02
机器学习实践中应避免的7种常见错误 在机器学习领域,每个给定的建模问题都存在几十种解法,本文作者认为,模型算法的假设并不一定适用于手头的数据;在追求模型最佳性能时,重要的是选择适合数据集(尤其是“ ...

决策树算法真的越复杂越好吗?

决策树算法真的越复杂越好吗?
2016-05-25
决策树算法真的越复杂越好吗? 凡是在统计分析或机器学习领域从业的朋友们,对决策树这个名词肯定都不陌生吧。 决策树是一种解决分类问题的绝好方法,顾名思义,它正像一棵大树一样,由根部不断生长出很多 ...

你应该掌握的七种回归技术

你应该掌握的七种回归技术
2016-05-05
你应该掌握的七种回归技术 回归分析是建模和分析数据的重要工具。本文解释了回归分析的内涵及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回归等七种 ...

算法 | K-Means聚类算法的原理及实现

算法 | K-Means聚类算法的原理及实现
2016-04-27
K-Means是聚类算法中的一种,其中K表示类别数,Means表示均值。顾名思义K-Means是一种通过均值对数据点进行聚类的算法。K-Means算法通过预先设定的K值及每个类别的初始质心对相似的数据点进行划分。并通过划分后的均 ...

基于树的建模-完整教程(R & Python)

基于树的建模-完整教程(R & Python)
2016-04-21
基于树的建模-完整教程(R & Python) 基于树的学习算法被认为是最好的方法之一,主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型,它们映射非线性关 ...

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林
2016-04-20
WePay机器学习反欺诈实践:Python+scikit-learn+随机森林 什么是shell selling? 虽然欺诈几乎涉及各种领域,但相对于传统的买方或卖方仅仅担心对方是否是骗子,支付平台需要担心的是交易双方。如果其中任何 ...

如何利用机器学习进行海量数据挖掘

如何利用机器学习进行海量数据挖掘
2016-04-20
互联网的海量数据不可能靠人工一个个处理,只能依靠计算机批量处理。最初的做法是人为设定好一些规则,由机器来执行。但特征一多规则就很难制定,即使定下了规则也没法根据实际情况灵活变化。机器学习可以很好的解决 ...

美团实例详解机器学习如何解决问题

美团实例详解机器学习如何解决问题
2016-04-06
前言:随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的 ...
解密 : 从互联网巨头数据挖掘类招聘笔试题目看我们还差多少知识
2016-04-02
1 从阿里数据分析师笔试看职业要求 以下试题是来自阿里巴巴招募实习生的一次笔试题,从笔试题的几个要求我们一起来看看数据分析的职业要求。 一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异常值( ...

详细解读如何构建专家诊病模型

详细解读如何构建专家诊病模型
2016-03-24
专家系统是典型的大数据和人工智能结合的计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。也就是说,专家系统是一个具有大量 ...

系统分析AlphaGo

系统分析AlphaGo
2016-03-15
来自田渊栋的知乎专栏,CDA数据分析师已获得作者授权 原文标题:AlphaGo的分析 最近我仔细看了下AlphaGo在《自然》杂志上发表的文章,写一些分析给大家分享。 AlphaGo这个系统主要由几个部分组成: 1.走棋网络(P ...

以性别预测为例,谈谈数据挖掘中的分类问题

以性别预测为例,谈谈数据挖掘中的分类问题
2016-03-02
以性别预测为例,谈谈数据挖掘中的分类问题 互联网的迅猛发展,催生了数据的爆炸式增长。面对海量的数据,如何挖掘数据的价值,成为一个越来越重要的问题。本文首先介绍数据挖掘的基本内容,然后按照数据挖掘 ...
把小样本经验用在海量样本筛选上,才是大数据的价值
2016-02-26
把小样本经验用在海量样本筛选上,才是大数据的价值 从小样本到大数据:概念与误区 最近两年产生并记录的数据,总量占到人类文明以来所有数据总和的90%。我们源源不断记录着一切有价值的信息, ...

机器学习算法一览

机器学习算法一览
2016-01-18
文 | 寒小阳 来源  | CSDN博客 引言 提起笔来写这篇博客,突然有点愧疚和尴尬。愧疚的是,工作杂事多,加之懒癌严重,导致这个系列一直没有更新,向关注该系列的同学们道个 ...

数据挖掘:推荐系统综述以及美团推荐系统介绍

数据挖掘:推荐系统综述以及美团推荐系统介绍
2015-12-29
数据挖掘:推荐系统综述以及美团推荐系统介绍 文 | 宿痕 来源 | 知乎 其实推荐系统前面已经讲过不少,那时候主要是放在机器学习上讲的,既然这次要系统撸一遍数据挖掘,就把推荐系统单 ...

R语言与机器学习学习笔记2(分类算法)

R语言与机器学习学习笔记2(分类算法)
2015-12-17
R语言与机器学习学习笔记2(分类算法)  当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐藏层、输入层逐层反传。周而复始的信息正向传 ...

这七种回归分析技术,学了不后悔~

这七种回归分析技术,学了不后悔~
2015-11-28
这七种回归分析技术,学了不后悔~ 什么是回归分析? 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现 ...

OK