cda

数字化人才认证

首页 > 行业图谱 >

123 3/3

非平衡数据集的机器学习常用处理方法

非平衡数据集的机器学习常用处理方法
2018-03-26
非平衡数据集的机器学习常用处理方法 定义:不平衡数据集:在分类等问题中,正负样本,或者各个类别的样本数目不一致。 例子:在人脸检测中,比如训练库有10万张人脸图像,其中9万没有包含人脸,1万包含人 ...

机器学习中非平衡数据集的常用处理方法

机器学习中非平衡数据集的常用处理方法
2018-03-25
机器学习中非平衡数据集的常用处理方法 不平衡数据集: 在分类等问题中,正负样本,或者各个类别的样本数目不一致。 :在人脸检测中,比如训练库有10万张人脸图像,其中9万没有包含人脸,1万包含人脸, ...
R语言中样本平衡的几种方法
2017-12-06
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱
2017-07-24
机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱 本文主要解释一些关于机器学习模型评价的主要概念,与评价中可能会遇到的一些陷阱。如训练集-验证集二划分校验(Hold-out validation) ...

Python机器学习实战:信用卡欺诈检测

Python机器学习实战:信用卡欺诈检测
2017-06-05
Python机器学习实战:信用卡欺诈检测 故事背景:原始数据为个人交易记录,但是考虑数据本身的隐私性,已经对原始数据进行了类似PCA的处理,现在已经把特征数据提取好了,接下来的目的就是如何建立模型使得检测 ...

大数据的核心价值到底是什么

大数据的核心价值到底是什么
2017-05-20
大数据的核心价值到底是什么 无论是大数据在农业的应用也好,工业的应用也好,抑或是在金融行业的应用也好,最终都是通过大数据技术来获知事情发展的真相,最终利用这个“真相”来更加合理的配置资源。 具体 ...

R语言不平衡数据分类指南

R语言不平衡数据分类指南
2017-02-27
R语言不平衡数据分类指南 目前我们发展出了不少机器学习算法来对数据建模,基于数据进行一些预测已经不再是难事。不论我们建立的是回归或是分类模型,只要我们选择了合适的算法,总能得到比较精确的结果。然而 ...

用R语言实现对不平衡数据的四种处理方法

用R语言实现对不平衡数据的四种处理方法
2016-09-07
用R语言实现对不平衡数据的四种处理方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。那么,这种结果是为何发生的呢?到底是什 ...

大数据时代抽样的是是非非

大数据时代抽样的是是非非
2015-12-20
大数据时代抽样的是是非非 现在到处都在谈大数据,相关的图书里面舍恩伯格的《大数据时代》写得最精彩也最具影响力,书中明确提出:在大数据分析和应用中,不应着眼于如何使用(随机)抽样技术,而应该使用大样 ...

大数据让电视台更懂观众的心_数据分析师

大数据让电视台更懂观众的心_数据分析师
2015-02-28
大数据让电视台更懂观众的心_数据分析师   “除了上帝,任何人都必须用数据来说话。”管理学大师爱德华.戴明(Edwards.Deming)早在上世纪中期便提出过这个观点。如今,大数据推动“让数据说话”成为一 ...
宝洁中国、阿里巴巴 消费者洞察与大数据对话_数据分析师
2014-12-13
宝洁中国、阿里巴巴 消费者洞察与大数据对话_数据分析师 昨天的虎嗅F&M创新节的“如何洞察用户:阿里与宝洁的大数据实战”专场里,阿里巴巴数据委员会会长车品觉、宝洁中国市场研究部总经理李霈、英特尔中国 ...
123 3/3

OK