cda

数字化人才认证

首页 > 行业图谱 >

机器学习之深度学习

机器学习之深度学习
2017-07-25
机器学习之深度学习 本文基于台大机器学习技法系列课程进行的笔记总结。 一、主要内容 topic 1  深度神经网络结构 从类神经网络结构中我们已经发现了神经网络中的每一层实际上都是对前一层进 ...

基于R语言构建的电影评分预测模型

基于R语言构建的电影评分预测模型
2017-07-16
基于R语言构建的电影评分预测模型 电影评分系统是一种常见的推荐系统。现在使用R语言基于协同过滤算法来构建一个电影评分预测模型。 一,前提准备 1.R语言包:ggplot2包(绘图),recommenderlab包,resh ...

机器学习中的特征—特征选择的方法以及注意点

机器学习中的特征—特征选择的方法以及注意点
2017-07-04
机器学习中的特征—特征选择的方法以及注意点 关于机器学习中的特征我有话要说 在这次校园招聘的过程中,我学到了很多的东西,也纠正了我之前的算法至上的思想,尤其是面试百度的过程中,让我渐渐意识到 ...

R语言做主成分分析实例

R语言做主成分分析实例
2017-06-12
R语言做主成分分析实例 在做多样本的RNA-Seq数据中经常会用到主成分分析(PCA)来分析,那么什么是PCA呢,这个可以百度一下,大概意思如下: 主成分分析法是数据挖掘中常用的一种降维算法,是Pearson在1901年 ...

Python机器学习实战:信用卡欺诈检测

Python机器学习实战:信用卡欺诈检测
2017-06-05
Python机器学习实战:信用卡欺诈检测 故事背景:原始数据为个人交易记录,但是考虑数据本身的隐私性,已经对原始数据进行了类似PCA的处理,现在已经把特征数据提取好了,接下来的目的就是如何建立模型使得检测 ...

关于如何解释机器学习的一些方法

关于如何解释机器学习的一些方法
2017-05-20
关于如何解释机器学习的一些方法 到现在你可能听说过种种奇闻轶事,比如机器学习算法通过利用大数据能够预测某位慈善家是否会捐款给基金会啦,预测一个在新生儿重症病房的婴儿是否会罹患败血症啦,或者预测一位 ...

机器学习的道、法、术、势、器

机器学习的道、法、术、势、器
2017-05-13
机器学习的道、法、术、势、器 “道、法、术、器”出于老子的《道德经》,后人又加了一个“势”,并且也有了不同的排列。很多人习惯用“道、法、术、势、器”的顺序,原因很简单:道以明向、法以立本、术以立策 ...

机器学习项目中的数据预处理与数据整理之比较

机器学习项目中的数据预处理与数据整理之比较
2017-05-10
机器学习项目中的数据预处理与数据整理之比较 要点 在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。 市场上有各种用于数据清洗和特征工程的编程语言、框架和工具。它们之间的 ...

异常检测的数据挖掘方法

异常检测的数据挖掘方法
2017-05-06
异常检测的数据挖掘方法 我们正淹没在从世界范围内收集的海量的数据里,同时我们也渴求知识 异常事件发生相对较少 然而,一旦发生,它们的影响将会很戏剧性,并且通常具有负面影响 \"在草堆中找针 ...

利用Python练习数据挖掘

利用Python练习数据挖掘
2017-05-03
利用Python练习数据挖掘 覆盖使用Python进行数据挖掘查找和描述数据结构模式的实践工具。 第一节 介绍 数据挖掘是一个隐式提取以前未知的潜在有用的数据信息提取方式。它使用广泛,并且是众多应用的技术基础。 ...

sas批量删除重复超过90%的变量

sas批量删除重复超过90%的变量
2017-04-19
sas批量删除重复超过90%的变量 22年前的今天我的妈咪把我带来这个世界,费尽心思把我养到这么大,我就是4月份出生的大白羊,我的生日愿望呢,就是想有个大神在留言板块教我一个怎么识别组合变量更好解释因变量 ...

R语言画图教程之盒形图

R语言画图教程之盒形图
2017-04-07
R语言画图教程之盒形图 我们之前有分享过一系列的R语言画图代码(PCA图、Pathway图、火山图、RDA图、热图),今天再来补充一个盒形图(箱形图)的代码。 以下代码只是示例,不能直接搬来用哦,注意看注释。 ...
谷歌微软等科技巨头数据科学岗位面试题(108道)
2017-04-05
来自 Glassdoor 的最新数据可以告诉我们各大科技公司最近在招聘面试时最喜欢向候选人提什么问题。首先有一个令人惋惜的结论:根据统计,几乎所有的公司都有着自己的不同风格。由于 Glassdoor 允许匿名提交内容,很 ...

从模型选择到超参调整,六步教你如何为机器学习项目选择算法

从模型选择到超参调整,六步教你如何为机器学习项目选择算法
2017-04-01
从模型选择到超参调整,六步教你如何为机器学习项目选择算法 随着机器学习的进一步火热,越来越多的算法已经可以用在许多任务的执行上,并且表现出色。 但是动手之前到底哪个算法可以解决我们特定的实际问 ...

论文中的机器学习算法——基于密度峰值的聚类算法

论文中的机器学习算法——基于密度峰值的聚类算法
2017-03-21
论文中的机器学习算法——基于密度峰值的聚类算法 下面还是主要来谈谈论文的主要思想。 算法的主要思想思想     在聚类算法中主要有这样几种: 划分的方法,如K-Means ...

SPSS数据分析—多维偏好分析(MPA)

SPSS数据分析—多维偏好分析(MPA)
2017-03-13
SPSS数据分析—多维偏好分析(MPA) 之前的主成分分析和因子分析中,收集的变量数据都是连续型数值,但有时会碰到分类数据的情况,我们知道最优尺度变换可以对分类变量进行量化处理,如果将这一方法和主 ...

机器学习中特征选择概述

机器学习中特征选择概述
2017-03-11
机器学习中特征选择概述 1. 背景 1.1 问题 在机器学习的实际应用中,特征数量可能较多,其中可能存在不相关的特征,特征之间也可能存在相关性,容易导致如下的后果:  (1) 特征个数越多,分析特征 ...

数据科学家的66个工作面试问题

数据科学家的66个工作面试问题
2017-03-06
数据科学家的66个工作面试问题 我们现在有91个问题。我们还添加了50个新的人  在这里,并开始提供这些问题的答案  在这里。这些都是开放式问题,以评估一个高级职位的高级候选人的技术水平知识,例如 ...

聚类分析基础知识总结及实战解析

聚类分析基础知识总结及实战解析
2016-11-28
聚类分析基础知识总结及实战解析 聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分 ...
SPSS Syntax中的常用函数
2016-10-30
SPSS Syntax中的常用函数 SPSS函数是一个常用程序(rountine),并且利用一个或多个自变量(参数)来执行。每个SPSS函数均有一个关键名称(keywordname),且绝不能写错。通常,函数的格式为:函数名称(自变量 ...

OK