cda

数字化人才认证

首页 > 行业图谱 >

手把手教你如何使用seaborn绘图--数据集分布可视化

手把手教你如何使用seaborn绘图--数据集分布可视化
2020-08-10
seaborn是一款基于matplotlib的图形可视化python库,它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。seaborn主要是针对统计绘图的,一般来说,seaborn能满足数据分析90%的绘图需求,它最大 ...

原理+代码|python基于主成分分析的客户信贷评级实战

原理+代码|python基于主成分分析的客户信贷评级实战
2020-08-10
小编今天跟大家分享的文章是关于python基于主成分分析的客户信贷评级实战的,大家在学习python过程中要注意理论学习与实际案例操作相结合,这样才能更好地掌握。好了,跟小编一起来看具体内容吧! 文章来 ...

教你使用3σ原则来进行异常值处理

教你使用3σ原则来进行异常值处理
2020-07-31
在python数据清洗过程中,我们经常会遇到一些偏离正常范围的数据,例如人的体重为56吨,这些数据叫做异常值,如果不做异常值处理,会对我们最终的数据分析造成影响。小编今天给大家带来了一种很实用的异常值处理方 ...

python数据清洗之噪声值的判断和处理

python数据清洗之噪声值的判断和处理
2020-07-31
提到噪声,你会想到什么?刺耳的,高分贝的声音?总之就是不好的,不想接受的声音。小编今天跟大家分享的就是python数据清洗中的噪声数据,对于这些噪声数据我们应该怎样检测和处理呢?下面跟小编一起来看吧。 一 ...

这几种常见的假设检验方法,你了解吗?

这几种常见的假设检验方法,你了解吗?
2020-07-28
假设检验问题是统计推断中的一类重要问题,小编在之前给大家整理,分享过假设检验的基本步骤,今天给大家带来的是常见的假设检验方法,希望对大家有所帮助。 一、假设检验基本概念 假设检验是用来判断样本与 ...

数据分析中R语言缺失值的判断和处理方法有哪些?

数据分析中R语言缺失值的判断和处理方法有哪些?
2020-07-17
R语言是一种用来进行数据分析、绘图的解释型语言。而我们在数据分析过程中会遇到许多缺失值,我们必须对这些缺失值进行处理,才能更好地进行下一步工作。今天小编跟大家分享R语言缺失值的判别和处理方法,希望对大 ...

数据处理中,偏态数据如何正态化?

数据处理中,偏态数据如何正态化?
2020-07-17
在数据处理过程中,经常会遇到偏态数据。我们都知道数据整体服从正态分布,那样本均值和方差则相互独立。因此大家都会希望数据事成正态分布的,但是现实情况却是:大多数情况下,数据都是偏态分布的,这时候就需要 ...

python数据清洗中,是如何识别和处理异常值的?

python数据清洗中,是如何识别和处理异常值的?
2020-07-17
异常值处理是python数据清洗中重要的步骤,虽然异常值出现频率比较低,但是如果置之不理的话,还是会对实际项目的分析造成偏差,所以今天小编就跟大家分享python数据清洗中应该如何识别和处理异常值,希望对大家有 ...

如何清晰的理解Z-Score这种数据标准化的处理方法?

如何清晰的理解Z-Score这种数据标准化的处理方法?
2020-07-10
Z-Score是数据标准化处理的一种常用方法,通过Z-Score,可以将不同量级的数据转化为统一量度的Z-Score分值,并进行比较。 (1)Z-score定义 根据图可以看出,Z-score的数据分布满足“正态分布”(N(0.1)) ...

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了
2020-07-13
作者:张良均 谭立云 刘名军 江建明 来源:大数据DT(ID:hzdashuju) 内容摘编自《Python数据分析与挖掘实战》(第2版) 导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是 ...

这3种数据标准化方法,你知道吗?

这3种数据标准化方法,你知道吗?
2020-07-09
数据标准化(normalization)是一个常用的数据预处理操作,就是对原始各项指标数据按比例进行缩放,将数据的单位限制去除,转化为无规模、无量纲的纯数值,减少规模、特征、分布差异等对模型的影响,以便于不同单位 ...
假设检验应该遵循什么样的步骤?它的方法有哪些?
2020-07-07
假设检验是根据一定的假设条件,由样本推断总体的一种方法。 假设检验问题是统计推断中的一类重要问题,在总体的分布函数完全未知或只知其形式,不知其参数的情况,为了推断总体的某些未知特性,提出某些关于总 ...

朴素贝叶斯算法的简单理解和介绍

朴素贝叶斯算法的简单理解和介绍
2020-07-01
贝叶斯分类是一类分类算法的总称,这类算法都是以贝叶斯定理为基础,所以统称为贝叶斯分类。贝叶斯分类中最简单,同时也是常见的一种分类方法就是朴素贝叶斯分类。下面小编来简单介绍一下朴素贝叶斯分类。 一、 ...

对于T分布来源和定义的简单理解

对于T分布来源和定义的简单理解
2020-07-01
相信各位统计学的小伙伴对于T分布并不陌生,T分布,即学生T-分布(Student\'s t-distribution),经常被应用在对呈正态分布的总体的均值进行估计。下面小编就具体来介绍一下T分布。 一、T分布的来源 简单 ...

偏态数据:何为数据的偏态分布?

偏态数据:何为数据的偏态分布?
2020-06-29
相信大家在一定有接触过偏态分布这一概念,在统计学偏态分布,是指统计数据峰值与平均值不相等的频率分布。根据峰值小于或大于平均值可分为正偏函数和负偏函数,其偏离的程度可用偏态系数刻画。在数据预处理过程中 ...

什么是卡方分布,有什么特征?

什么是卡方分布,有什么特征?
2020-06-24
一、卡方分布定义 卡方分布 (χ2分布)是概率论与统计学中常用的一种概率分布。k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。卡方分布常用于假设检验和置信区间的计算。 若k 个随机变量Z1、 ...
python知识普及:numpy基础操作
2020-06-10
Numpy基础数据结构 import numpy as np ar = np.array([[1,2,3], [3,4,6], [4,5,7]])  # 二维数组 print(ar) print(type(ar)) ar [[1 2 3] [3 4 6] [4 5 7]] array([[1, 2, 3],       ...

非参数统计检验中的假设检验是指什么?

非参数统计检验中的假设检验是指什么?
2020-05-29
1980年代末,汉斯拉伊大学(Hansraj College)经济学荣誉毕业生的平均薪酬约为每年100万印度卢比。这一数字大大高于80年代初或90年代初毕业的人们。 他们平均水平如此之高的原因是什么呢?沙鲁克·汗是印度收入最 ...

阿特曼Z-Score模型怎么做?

阿特曼Z-Score模型怎么做?
2020-05-20
Z-Score,又称为再Z分数、标准分数,一个数与平均数的差再除以标准差的过程。 Z-Score能够衡量出一个分数距离平均数的相对标准距离,如果我们把每一个分数都转换成z分数,那么每一个z分数会以标准差为单位表示 ...

机器学习中的概率估计指什么?

机器学习中的概率估计指什么?
2020-05-19
机器学习算法会涉及到大量的数学基础内容,数学好的童靴们,你们的优势来了。在机器学习中涉及到了三个数学工具,分别是线性代数、概率统计(概率估计)、最优化理论。 今天,我们来讲概率统计,在机器学习中会涉及 ...

OK