cda

数字化人才认证

首页 > 行业图谱 >

资源 | 一个Python特征选择工具,助力实现高效机器学习

资源 | 一个Python特征选择工具,助力实现高效机器学习
2018-07-11
资源 | 一个Python特征选择工具,助力实现高效机器学习 鉴于特征选择在机器学习过程中的重要性,数据科学家 William Koehrsen 近日在 GitHub 上公布了一个特征选择器 Python 类,帮助研究者更高效地完成特征选 ...

统计学笔记:箱型图以及python实践

统计学笔记:箱型图以及python实践
2020-05-11
最近在接触kaggle的竞赛示例,练习了一下,感觉受益匪浅。同时,心中也有个问题。拿到数据之后第一件事是什么?分析数据的情况?怎么分析?分析之后如何去处理数据呢?等等一些数据分析的工作。其中,大家都可能非 ...

算法太多挑花眼?教你如何选择正确的机器学习算法

算法太多挑花眼?教你如何选择正确的机器学习算法
2018-07-05
算法太多挑花眼?教你如何选择正确的机器学习算法 机器学习算法虽多,却没有什么普适的解决方案。决策树、随机森林、朴素贝叶斯、深度网络等等等等,是不是有时候觉得挑花了眼呢?福利来啦~本文将教你慧眼识精 ...

SPSS操作:多个独立样本的非参数检验及两两比较

SPSS操作:多个独立样本的非参数检验及两两比较
2018-06-25
SPSS操作:多个独立样本的非参数检验及两两比较 一、问题与数据 某研究者想探讨不同体力活动的人,应对职场压力的能力是否不同。因此,研究招募了31名研究对象,测量了他们每周进行体力活动的时间(分钟), ...

数据挖掘的六大主要功能

数据挖掘的六大主要功能
2018-06-25
数据挖掘的六大主要功能 数据挖掘的历史虽然较短,但从20世纪90年代以来,它的发展速度很快,加之它是多学科综合的产物,目前还没有一个完整的定义,人们提出了多种数据挖掘的定义,例如:SAS研究所(1997): ...

盘点丨2018 年热门 Python 库丨TOP20

盘点丨2018 年热门 Python 库丨TOP20
2018-06-20
盘点丨2018 年热门 Python 库丨TOP20 在解决数据科学任务和挑战方面,Python继续处于领先地位。去年,我对当时热门的Python库进行了总结。今年,我在当中加入新的库,重新对2018年热门Python库进行全面盘点。 ...

python实现识别相似图片小结

python实现识别相似图片小结
2018-04-01
python实现识别相似图片小结 在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系。 当然了,图像识别这个话题作为计算机科学的一个分 ...

人脸识别中常用的几种分类器

人脸识别中常用的几种分类器
2018-03-28
人脸识别中常用的几种分类器 在人脸识别中有几种常用的分类器,一是最邻近分类器;二是线性分类器 (1)最邻近分类器 最近邻分类器是模式识别领域中最常用的分类方法之一,其直观简单,在通常的应用环境 ...

Stata软件对截断和删失数据处理方法介绍

Stata软件对截断和删失数据处理方法介绍
2018-03-24
Stata软件对截断和删失数据处理方法介绍 截断和删失是完全不同的现象,都会导致我们的样本不完整。这些现象出现在医疗科学、工程、社会科学和其他研究领域。如果忽略截断和删失,当我们分析数据时,我们的人口 ...

利用Stata进行概要统计及交互表统计

利用Stata进行概要统计及交互表统计
2018-03-24
利用Stata进行概要统计及交互表统计 【命令范式】 summarize y1 y2 y3 对所列变量计算简单的概要统计量 summarize y1 y2 y3, detail 获取详细的描述性统计,包括百分位数,中位数,平均数,标准差,方差,偏度 ...

利用Python破解验证码实例详解

利用Python破解验证码实例详解
2018-03-22
利用Python破解验证码实例详解 这篇文章主要给大家介绍的是如何通过一个简单的例子来实现破解验证码。从本文中我们可以学习到 Python 基本知识,PIL 模块的使用,破解验证码的原理。文中通过实例一步步介绍的 ...

R语言中的概率论和数理统计

R语言中的概率论和数理统计
2018-03-13
R语言中的概率论和数理统计 一、随机变量 (一)、什么是随机变量? 1.定义 随机变量(random variable)表示随机现象各种结果的实值函数。随机变量是定义在样本空间S上,取值在实数域上的函数, ...

R语言中的几种图

R语言中的几种图
2018-03-12
R语言中的几种图 R语言中,常见的图有直方图、箱线图、条形图、点阵图、饼图、QQ图。 1.直方图 直方图是直观了解数据分布的常用图形,它将连续型数据分为等间距的组,并以矩形的高低来显示相应组中所 ...

R语言之随机数与抽样模拟篇

R语言之随机数与抽样模拟篇
2018-03-12
R语言之随机数与抽样模拟篇 R语言生成均匀分布随机数的函数是runif() 句法是:runif(n,min=0,max=1)    n表示生成的随机数数量,min表示均匀分布的下限,max表示均匀分布的上限;若省略参数mi ...

R语言自定义函数,利用QQ图和shaprio.test检验正态分布

R语言自定义函数,利用QQ图和shaprio.test检验正态分布
2018-03-11
R语言自定义函数,利用QQ图和shaprio.test检验正态分布 代码 #自定义函数 norm.test<-function(data,alpha=0.05,pic=TRUE){ #alpha为显著性水平,这里的默认值为0.05  if(pic==TRUE) ...

(笔记)spss的描述统计和比较均值

(笔记)spss的描述统计和比较均值
2018-03-05
(笔记)spss的描述统计和比较均值 描述统计: 分析-描述统计,包括:频率,描述,搜索,交叉表,比率,P-P图,Q-Q图 1,频率:分析多个样本中取值的出现频次,求得这些频次的 ...

Python 爬取淘宝商品数据挖掘分析实战

Python 爬取淘宝商品数据挖掘分析实战
2018-03-03
Python 爬取淘宝商品数据挖掘分析实战 项目内容 本案例选择>> 商品类目:沙发; 数量:共100页  4400个商品; 筛选条件:天猫、销量从高到低、价格500元以上。 项目目的 1. 对商 ...

SPSS之偏态分布的激素水平影响因素分析

SPSS之偏态分布的激素水平影响因素分析
2018-03-03
SPSS之偏态分布的激素水平影响因素分析 概况:某种激素水平对胃癌的发生有一定的作用,把病人分为实验组和对照组。 性别:男、女。 年龄:青年(<45岁)、中年(45岁~59岁)、 ...

使用Python进行描述性统计

使用Python进行描述性统计
2018-02-26
使用Python进行描述性统计 1 描述性统计是什么? 描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,我们可借助描述性统计来描绘或总结数据的基本情况,一来可以梳 ...

机器学习中防止过拟合方法

机器学习中防止过拟合方法
2018-02-25
机器学习中防止过拟合方法 过拟合 在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布,即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模 ...

OK