首页 > 行业图谱 >

- 数据挖掘中易栽的10个坑
2017-05-03
-
数据挖掘中易栽的10个坑
1.缺乏数据
对于分类问题或预估问题来说,常常缺乏准确标注的案例。
例如:
-欺诈侦测(:在上百万的交易中,可能只有屈指可数的欺诈交易,还有很多的欺诈交易没有被正确标 ...

- SPSS因子分析法-例子解释
2017-05-02
-
SPSS因子分析法-例子解释
因子分析的基本概念和步骤
一、因子分析的意义
在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。例如,对高等学校科研状况的评 ...

- R语言中如何使用最小二乘法
2017-04-28
-
R语言中如何使用最小二乘法
这里只是介绍下R语言中如何使用最小二乘法解决一次函数的线性回归问题。
代码如下:
> x<-c(6.19,2.51,7.29,7.01,5.7,2.66,3.98, ...

- Spss的基本方法使用步骤
2017-04-23
-
Spss的基本方法使用步骤
由于一次的调研工作,我们的数据分析采用spss的统计分析工具,然后我是一个新人,全都是一步一步从零开始操作的。在学习的过程中简单记录了一点笔记,既然写了,就觉得应该把它保存下来 ...

- 使用Excel进行回归分析,预测真实值
2017-04-14
-
前言
昨天学习了 Excel 中的相关分析,在数据分析中,相关分析和回归分析关系紧密,今天来学习下 Excel 中的回归分析。
回归分析
回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的 ...

- SPSS分析技术:判别分析
2017-04-06
-
SPSS分析技术:判别分析
在数据处理中,有这样一种情况:现在已经有若干样本被正确地分类了,但不清楚分类的依据是什么。同时,未来还会有大量的未被分类的样本,需要按照上述规则判定这些样本的所属类别。为此 ...

- 岭回归分析及其SPSS实现方法
2017-04-05
-
岭回归分析及其SPSS实现方法
近日有医院的小伙伴问起岭回归分析的SPSS操作,在此与大家一起复习一下。
岭回归分析(RidgeRegression)是一种改良的最小二乘估计方法,它是用于解决在线性回归分析中自变量存 ...
- 谷歌微软等科技巨头数据科学岗位面试题(108道)
2017-04-05
-
来自 Glassdoor 的最新数据可以告诉我们各大科技公司最近在招聘面试时最喜欢向候选人提什么问题。首先有一个令人惋惜的结论:根据统计,几乎所有的公司都有着自己的不同风格。由于 Glassdoor 允许匿名提交内容,很 ...

- sas输出基尼方差,F检验
2017-04-03
-
sas输出基尼方差,F检验
有时候,我们在建模前期会有一个变量探索的单变量与因变量的数据分析报告,但其实,不同的数据形式有不同的指标来衡量变量与因变量的解释能力
今天的代码介绍的就是单变量与因变量之 ...

- 扒一扒真实的大数据行业
2017-04-02
-
扒一扒真实的大数据行业
大数据是近年来方兴未艾的行业,也是企业服务的一个重要门类,在上一期的文章中做了简单的罗列和介绍。在今天的文章中,水镜先生结合自己的专业知识,为大家扒一扒真实的大数据行业。
...

- 从模型选择到超参调整,六步教你如何为机器学习项目选择算法
2017-04-01
-
从模型选择到超参调整,六步教你如何为机器学习项目选择算法
随着机器学习的进一步火热,越来越多的算法已经可以用在许多任务的执行上,并且表现出色。
但是动手之前到底哪个算法可以解决我们特定的实际问 ...

- 学习SAS的正确姿势是怎样的?
2022-01-20
-
SAS作为世界知名大数据分析产品,只要是大机构, 不论是、制药、金融、保险、市场部门、NGO还是政府部门,SAS的覆盖率,都是完全不可被替代的。甚至部分IT公司在统计软件上,也选择的是SAS。同时SAS系统具有使用灵 ...

- 简单易学的机器学习算法—岭回归(Ridge Regression)
2017-03-24
-
简单易学的机器学习算法—岭回归(Ridge Regression)
一、一般线性回归遇到的问题
在处理复杂的数据的回归问题时,普通的线性回归会遇到一些问题,主要表现在:
预测精度:这里要处理好这样 ...

- 简单易学的机器学习算法—分类回归树CART
2017-03-22
-
简单易学的机器学习算法—分类回归树CART
分类回归树(Classification and Regression Tree,CART)是一种典型的决策树算法,CART算法不仅可以应用于分类问题,而且可以用于回归问题。
一、树回归的概念
...

- 机器学习-回归模型-欠拟合和过拟合
2017-03-20
-
机器学习-回归模型-欠拟合和过拟合
1. 什么是欠拟合和过拟合
先看三张图片,这三张图片是线性回归模型 拟合的函数和训练集的关系
第一张图片拟合的函数和训练集误差较大,我们称这种情况为 欠拟合
...

- 从曲线拟合问题窥视机器学习中的相关概念
2017-03-20
-
从曲线拟合问题窥视机器学习中的相关概念
一直徘徊在机器学习的边缘未敢轻易造次并畏惧其基本原理思想,从每一本厚厚的参考资料中都可以看出机器学习是一门跨越概率论、决策论、信息论以及最优化的学科的综合学 ...

- 机器学习中的隐马尔科夫模型(HMM)详解
2017-03-18
-
机器学习中的隐马尔科夫模型(HMM)详解
在之前介绍贝叶斯网络的博文中,我们已经讨论过概率图模型(PGM)的概念了。Russell等在文献【1】中指出:“在统计学中,图模型这个术语指包含贝叶斯网络在内的比较宽泛 ...

- 机器学习实现与分析之四(广义线性模型)
2017-03-15
-
机器学习实现与分析之四(广义线性模型)
指数分布族
首先需要提及下指数分布族,它是指一系列的分布,只要其概率密度函数可以写成下面这样的形式:
一般的很多分布(如高斯分布,泊松分布,二项 ...

- 干货 | 基础机器学习算法
2017-03-10
-
本篇内容主要是面向机器学习初学者,介绍常见的机器学习算法,当然,欢迎同行交流。
哲学要回答的基本问题是从哪里来、我是谁、到哪里去,寻找答案的过程或许可以借鉴机器学习的套路:组织数据->挖掘知识->预测未来。 ...

- 数据统计分析方法
2017-03-07
-
数据统计分析方法
数据分析是把隐没在一大批看来杂乱无章的数据中的信息,集中、萃取和提炼出来,以找出所研究对象的内在规律,并提供决策支持的一系列分析过程。数据统计分析方法已经应用到各行各业,在互联网 ...