cda

数字化人才认证

首页 > 行业图谱 >

一文搞定数据科学和机器学习的最常见面试题

一文搞定数据科学和机器学习的最常见面试题
2018-06-13
一文搞定数据科学和机器学习的最常见面试题 去的几个月中,我参加了一些公司数据科学、机器学习等方向初级岗位的面试。 我面试的这些岗位和数据科学、常规机器学习还有专业的自然语言处理、计算机视觉相关。 ...

机器学习模型可解释的重要及必要性

机器学习模型可解释的重要及必要性
2018-06-06
机器学习模型可解释的重要及必要性 不管你是管理自己的资金还是客户资金,只要你在做资产管理,每一步的投资决策都意义重大,做技术分析或基本面分析的朋友很清楚地知道每一个决策的细节,但是通过机器学 ...

面试了8家公司,他们问了我这些机器学习题目......

面试了8家公司,他们问了我这些机器学习题目......
2018-05-04
面试了8家公司,他们问了我这些机器学习题目...... 今年年初以来,作者一直在印度找数据科学、机器学习以及深度学习领域的工作。在找工作的这三十四天里,他面试了8到10家公司,其中也包括初创公司、基于服务 ...

不平衡学习算法的评估指标

不平衡学习算法的评估指标
2018-04-05
不平衡学习算法的评估指标 先来看下类不平衡的定义:对于二元分类问题,存在类别分布不平衡的问题,即某一类别的样本数量远远多于另一类(分别称为多数类和少数类)。具有这样特征的二元分类数据集被称为不平衡 ...

在机器学习分类中如何处理训练集中不平衡问题

在机器学习分类中如何处理训练集中不平衡问题
2018-04-01
在机器学习分类中如何处理训练集中不平衡问题 很多机器学习任务中,训练集中可能会存在某个或某些类别下的样本数远大于另一些类别下的样本数目。即类别不平衡,为了使得学习达到更好的效果,因此需要解决该类别 ...

数据分析师—技术面试

数据分析师—技术面试
2018-03-29
数据分析师—技术面试 三月份开始找实习,到现在已经有半年的时间了,在这半年的时间中,该经历的基本上都已经经历,春招实习时候,拿到了7个offer,校招时候,成功的拿下一份心仪的工作,结束了我的秋招旅程。 ...

非平衡数据集的机器学习常用处理方法

非平衡数据集的机器学习常用处理方法
2018-03-26
非平衡数据集的机器学习常用处理方法 定义:不平衡数据集:在分类等问题中,正负样本,或者各个类别的样本数目不一致。 例子:在人脸检测中,比如训练库有10万张人脸图像,其中9万没有包含人脸,1万包含人 ...

机器学习中非平衡数据集的常用处理方法

机器学习中非平衡数据集的常用处理方法
2018-03-25
机器学习中非平衡数据集的常用处理方法 不平衡数据集: 在分类等问题中,正负样本,或者各个类别的样本数目不一致。 :在人脸检测中,比如训练库有10万张人脸图像,其中9万没有包含人脸,1万包含人脸, ...

迈出数据分析与机器学习的第一步

迈出数据分析与机器学习的第一步
2018-03-25
迈出数据分析与机器学习的第一步 数据分析太火爆,怎奈机器学习太难懂!随着人工智能的浪潮卷卷袭来,机器学习已经越来越火爆啦。数据分析与机器学习岗位可谓供不应求,但是入门的门槛也是蛮高的,究竟了机器学 ...

常用的机器学习&数据挖掘知识点

常用的机器学习&数据挖掘知识点
2018-03-07
常用的机器学习&数据挖掘知识点 Basis(基础): MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最 ...

数据工作的科普总结

数据工作的科普总结
2017-11-28
数据工作的科普总结 首先说,这是一篇关于数据工作的科普文字,是我从事数据工作三年的一个小总结,因为不时会有人咨询我一些小问题,于是我大致整理了一下,主要是说了数据工作到底都包含了什么,其中关于数据 ...

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱
2017-07-24
机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱 本文主要解释一些关于机器学习模型评价的主要概念,与评价中可能会遇到的一些陷阱。如训练集-验证集二划分校验(Hold-out validation) ...

R文本分类之RTextTools

R文本分类之RTextTools
2017-05-09
R文本分类之RTextTools 古有曹植七步成诗,而RTextTools是一款让你可以在十步之内实现九种主流的机器学习分类器模型的文本分类开发包。 它集成了(或者说支持)如下算法相关的包: 支持向量机(Support Vec ...

微博商业数据挖掘方法

微博商业数据挖掘方法
2017-05-04
微博商业数据挖掘方法 本文主要介绍微博商业数据挖掘的体系及方法,但并不注重模型和算法这些细节,而是阐述数据如何贴近、支持和引导业务,如何建立合理的评价体系,以及如何围绕这两点建设数据挖掘架构。 ...

大数据舆情情感分析,如何提取情感并使用什么样的工具?

大数据舆情情感分析,如何提取情感并使用什么样的工具?
2017-03-28
各类 paper 是有一定的借鉴意义的,不过这主要是学术界在单个问题上的细化,要真正从研究领域落地到大数据的处理还有很多工作要做。 一、工程上的处理流程 工程上的处理流程具体包括 ...

如何快速搭建一篇数据化运营的大纲?

如何快速搭建一篇数据化运营的大纲?
2017-03-23
于是我希望,在七周成为数据分析师的系列后,把数据化运营作为第二个系列来完成。每次写文章,对自己也是一种总结和提升。 下面是一份「简略」的大纲,更恰当地说是草稿。当不久的将来开始正式写 ...

机器学习算法常用指标总结

机器学习算法常用指标总结
2017-03-11
机器学习算法常用指标总结 考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被 预测成正类,即为真正类(True positive), ...

浅谈机器学习在市场营销中的应用

浅谈机器学习在市场营销中的应用
2017-03-06
目前,在线展示广告越来越流行。在线展示广告的目的是获取更多的潜在客户,吸引客户购买商品。在线展示广告的一个基本要求就是通过广告获取用户所需费用要小于用户购买商品所耗费用,进而使得通过广告吸引来 ...

R语言不平衡数据分类指南

R语言不平衡数据分类指南
2017-02-27
R语言不平衡数据分类指南 目前我们发展出了不少机器学习算法来对数据建模,基于数据进行一些预测已经不再是难事。不论我们建立的是回归或是分类模型,只要我们选择了合适的算法,总能得到比较精确的结果。然而 ...

python数据挖掘之决策树DTC数据分析及鸢尾数据集分析

python数据挖掘之决策树DTC数据分析及鸢尾数据集分析
2020-04-20
Python数据挖掘之决策树DTC数据分析及鸢尾数据集分析  今天主要讲述的内容是关于决策树的知识,主要包括以下内容:1.分类及决策树算法介绍2.鸢尾花卉数据集介绍3.决策树实现鸢尾数据集分析。希望这篇文章 ...

OK
客服在线
立即咨询