Adams小乙

统计学习——矩阵的秩

矩阵的秩是线性代数中的一个概念。在线性代数中,一个矩阵A的列秩是A的线性独立的纵列的极大数,通常表示为r(A),rk(A)或rank A。在线性代数中,一个矩阵A的列秩是A的线性独立的纵列的极大数目。类似地,行秩是A的线性无关的横行的极大数目。即如果把矩阵看成一个个行向量或者列向量,秩就是这些行向量或者列向量的秩,也就是极大无关组中所含向量的个数。方阵(行数、列数相等的矩阵)的列秩和行秩总是相等的

Adams小乙

2022-02-12

37.0937 3 0
  • 关注作者
  • 收藏

python学习——Jupyter notebook快捷操作

Jupyter notebook有两种不同的键盘输入模式。 编辑模式允许您将代码或文本输入到一个单元格中,并通过一个绿色边框的单元格来表示 命令模式将键盘与笔记本级命令绑定在一起,并通过一个灰框、Jupyter 笔记本有两种不同的键盘输入模式。 编辑模式允许您将代码或文本输入到一个单元格中,并通过一个绿色边框的单元格来表示 命令模式将键盘与笔记本级命令绑定在一起,并通过一个灰框、左边距蓝色的单元格

Adams小乙

2022-02-11

17.3026 5 1
  • 关注作者
  • 收藏

统计学习——偏态分布

偏态分布是与“正态分布”相对,分布曲线左右不对称的数据次数分布,是连续随机变量概率分布的一种。可以通过峰度和偏度的计算,衡量偏态的程度。可分为正偏态和负偏态,前者曲线右侧偏长,左侧偏短;后者曲线左侧偏长,右侧偏短偏态分布(skewness distribution)指频数分布的高峰位于一侧,尾部向另一侧延伸的分布。它分为正偏态和负偏态。偏态分布的资料有时取对数后可以转化为正态分布,反映偏态分布的集

Adams小乙

2022-02-11

17.3026 4 0
  • 关注作者
  • 收藏

统计学习——正态分布

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。只要会用它求正态总体在某个特

Adams小乙

2022-02-11

83.8588 4 0
  • 关注作者
  • 收藏

统计学习——置信度

在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数测量值的可信程度范围,即前面所要求的“一定概率”。这个概率被称为置信水平。置信区间只在频率统计中使用。在贝叶斯统计中的对应概念是可信区间。但是可信区间和置信区间是建立在不同的概念基础上的,因此

Adams小乙

2022-02-10

6.4076 3 0
  • 关注作者
  • 收藏

Python学习——MAC系统下配置Anaconda目录插件

配置mac 系统下 Anaconda 软件目录插件需要在安装好软件后,打开终端,按如下步骤输入代码第一步:更新pip python -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple第二步:更新Jupyter pip install --upgrade jupyter -i https://pypi.t

Adams小乙

2022-02-09

31.2324 5 0
  • 关注作者
  • 收藏

统计学习——聚类算法原理

聚类方法1.层次聚类(Hierarchical Clustering)合并法、分解法、树状图2. 非层次聚类划分聚类、谱聚类聚类方法特征:· 聚类分析简单、直观。· 聚类分析主要应用于探索性的研究,其分析的结果可以提供多个可能的解,选择最终的解需要研究者的主观判断和后续的分析;· 不管实际数据中是否真正存在不同的类别,利用聚类分析都能得到分成若干类别的解;· 聚类分析的解完全依赖于研究者所

Adams小乙

2022-02-09

108.9181 5 0
  • 关注作者
  • 收藏

统计学习——聚类分析

聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类是将数据

Adams小乙

2022-02-09

30.6754 5 0
  • 关注作者
  • 收藏

统计学习——共线性

共线性,即同线性或同线型。统计学中,共线性即多重共线性。多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。原因(1)经济变量相关的共同趋势。

Adams小乙

2022-02-08

84.2405 6 0
  • 关注作者
  • 收藏

统计学习——残差分析

残差分析(residual analysis)就是通过残差所提供的信息,分析出数据的可靠性、周期性或其它干扰 。用于分析模型的假定正确与否的方法。所谓残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。在回归分析中,测定值与按回归方程预测的值之差,以δ表示。残差δ遵从正态分布N(0,σ2)。(δ-残差的均值)/残差的标准差,称为标准化残差,以δ*表示。δ*遵从标准正态分布N(

Adams小乙

2022-02-08

5.9299 5 0
  • 关注作者
  • 收藏

统计学习——过拟合

过拟合是指为了得到一致假设而使假设变得过度严格。避免过拟合是分类器设计中的一个核心任务。通常采用增大数据量和测试样本集的方法对分类器性能进行评价。给定一个假设空间H,一个假设h属于H,如果存在其他的假设h’属于H,使得在训练样例上h的错误率比h’小,但在整个实例分布上h’比h的错误率小,那么就说假设h过度拟合训练数据。常见原因:(1)建模样本选取有误,如样本数量太少,选样方法错误,样本标签错误等,

Adams小乙

2022-02-08

84.1724 4 0
  • 关注作者
  • 收藏

统计学习——方差分析

方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析(ANOVA)又称“变异数分析”或“F检验”,是由罗纳德·费雪爵士发明的,用于两个及两个

Adams小乙

2022-01-29

390.0467 7 0
  • 关注作者
  • 收藏

统计学习——回归分析

在统计学中,回归分析(regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。在大数据分析中,回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)

Adams小乙

2022-01-29

390.0467 7 0
  • 关注作者
  • 收藏

SQL学习——分组数据:group by 和 having 子句的运用于区分

在实际数据库表查询中,常常需要跟据需求将数据进行分类,而且不仅仅是返回结果那种,因此需要用到新的字句——GROUP BY子句和HAVING子句。 返回结果分类:SELECT COUNT(*) AS num_prodsFROM Products WHERE vend_id = ‘DLL01’;#返回供应商为“DLL01”的数量记为vend_id。 创建分组:SELECT语句中的GROUP BY 子句

Adams小乙

2022-01-27

150.0497 7 0
  • 关注作者
  • 收藏

SQL学习——循环语句:while,repeat和loop

1.while循环-- 设置mysql分隔符为//,也就意味着,当遇到下一个//时,整体执行SQL语句DELIMITER // DROP PROCEDURE if EXISTS ‘test’; # 如果存在test存储过程则删除CREATE procedure test() # 创建无参存储过程,名称为testBEGINDECLARE i INT; # 申明变量SET i = 0; #

Adams小乙

2022-01-25

119.4141 7 0
  • 关注作者
  • 收藏

Excel学习——单元格巧用

1. 设置单元格——右键——设置单元格格式——自定义——0‘单位’#使单元格计算时忽略单位2. 设置单元格——右键——设置单元格格式——自定义——@‘单位’#使单元格默认加上单位

Adams小乙

2022-01-24

32.6009 5 0
  • 关注作者
  • 收藏

SQL学习——聚合函数运用:聚合不同值

关于聚合函数,一般指对所有查找对象执行运算,而当有DISTINCT语句时,则可以实现不同值的聚合运算,达到了将重的目的,使计算结果更加科学化。 AVG(DISTINCT):SELECT AVG(DISTINCT prod_price) AS avg_price FROM Products WHERE vend_id = ‘DLL01’;#查询表中DLL01不同商品的平均单价。 COUNT(DIST

Adams小乙

2022-01-24

44.8698 8 0
  • 关注作者
  • 收藏

SQL学习——聚合函数:AVF(),COUNT(),MAX(),MIN(),SUM()

数据分析的实质并非调用数据,而是将纷繁的数据汇总分析,成为可视的信息。因而汇总数据在查询语句中显得格外重要。AVG函数:SELECT AVG(prod_price) AS avg_price FROM Products;#返回产品价格的平均值,作为平均值列的转化COUNT函数:COUNT(*) COUNT(column)SELECT COUNT(*) AS num_cust FROM Custom

Adams小乙

2022-01-24

41.7496 8 0
  • 关注作者
  • 收藏

SQL学习——SQL通用函数

文本处理函数:LEFT() #返回字符串左边的字符RIGHT() #返回字符串右边的字符LEN() #返回字符串长度UPPER() #返回字符串大写LTRIM() #去掉字符串左边的长度RTRIM() #去掉字符串右边的长度SUBSTRING() #返回提取字符串的组成部分数值处理函数:ABS()

Adams小乙

2022-01-22

70.9040 6 0
  • 关注作者
  • 收藏

SQL学习——创建表错误:1064,1075

1064:是指字段名未指定字段类型如上图:1075是指当表结构中一项被确定为主键时,其他项不可以被设置为自增长,因为只能有一个自动列,并且必须将其定义为键。

Adams小乙

2022-01-22

36.4696 6 0
  • 关注作者
  • 收藏

上一页123>