监督学习,就是通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具有了对未知数据进行分类的能力。 典型的例子就是KNN、SVM。 无监督学习(或者叫非监督学习)则是另一种。它与监督学习的不同之处,在于我们事先没有任何训练
W11YA
2019-04-24
Scikit-learn 要求: Python (>= 2.7 or >= 3.3), NumPy (>= 1.8.2), SciPy (>= 0.13.3). 如果你已经有一个安全的 numpy 和 scipy,安装 scikit-learn 最简单的方法是使用 pip pip install -U scikit-learn 或者 conda: conda install scikit-
W11YA
2019-04-24
首先要先导入数据 library(ggplot2) library(reshape2) > head(mydata) mpg disp hp drat wt qsec Mazda RX4 21.0 160 110 3.90 2.620
W11YA
2019-04-24
sub()、gsub()和chartr() 这三个功能都是 都是替换字符串。 sub和gsub参数都一样,例如:(pattern = , replacement = , text), 三函数区别是:sub只替换第一个符合条件的数据,gsub替换所有符合条件的数据,这两个函数都是把字符串 作为一个整体替换;而chartr是对单个字符进行替换。 sub("a", "@", 'a1a2a3')
W11YA
2019-04-23
可以用这两个函数大小写转换:toupper()和tolower() text = "abcDEF" toupper(text) tolower(text) # [1] "ABCDEF" # [1] "abcdef"
W11YA
2019-04-23
tryCatch()本身是一个函数,不报错时返回第一个表达式的结果,如果警告或者报错就返回wanining或者error的函数返回值。 无论如何,finnally中的表达式一定会执行,但不会作为tryCatch()的返回值。 result <- tryCatch({ }, warning = function(w){ }, error = function(e){ paste0('
W11YA
2019-04-23
最近闲来无事,看R语言。 学习过程中发现var()计算结果存在一定误差,如: x = c (2,4,6,8) var(x) = 6.666667 而我的计算结果是:5 查询相关资料发现:原来var()计算的是样本方差,而我计算的是总体方差。
W11YA
2019-04-23
seq(from,to,length), 该函数的意思是生成一组数字,每个参数的意思是从from开始,到to结束,每两个数间的间隔是length,如 seq(2,10,2),会生成一组数:2 4 6 8 10 seq(from,to,length.out=by)表示生成一组从from到to的数量为num的数 by = ((to - from)/(length.out - 1))
W11YA
2019-04-23
在R语言中sample函数是什么意思呢 比如这行代码 >sample(1:20,3) 这行代码的意思就是说,在1-20中间无放回的随机抽取3个数
W11YA
2019-04-23
在 Python 中用于生成随机数的模块是 random,在使用前需要 import. 如下例子可以酌情列 举: random.random():生成一个 0-1 之间的随机浮点数; random.uniform(a, b):生成[a,b]之间的浮点数; random.randint(a, b):生成[a,b]之间的整数; random.randrange(a, b, step):在指定
W11YA
2019-04-23
首先在要先建立数据库 然后使用数据库再进行建表, 因为表是在数据库下的,所以要选择数据库才可以建立 也就是说,我们在建表的时候, 1要看是否使用了数据库,2要看使用的数据库是不是想要建表的数据库
W11YA
2019-04-23
因为工作需要在好多电脑上安装了oracle数据库 总结了几个小问题 1、首先在安装之前有两个长得很像的压缩包文件夹,要解压在同一个文件夹下!!(这个很重要敲黑板) 2、也是很小的问题但是需要注意,就是安装的路径中不能有中文,安装之前一定要检查一下,不然就会卡在那进行不了 3、安装磁盘要有足够的空间,不然安装过程中还是要清理就会很麻烦,还是建议提前清理
W11YA
2019-04-23
我们打开excel之后发现界面都是英文该怎么办呢 1、点开文件,找到选项点击 2、出来这个页面 3、再点击语言栏 4、然后把中文设置成默认语言,就可以啦
W11YA
2019-04-23
python的数值类型很有意思:列表被称为打了激素的数值;元组里面的数不能改,可以作为函数传参;还是就是数据字典,包括键和数值;还有就是集合,集合里面的数据没有重复. list([X]) 转换为列表 set([X])集合 tuple([X]) 元组 dict([x])字典 str(X)字符串
W11YA
2019-04-22
r语言的data frame数据框,如果很大,比如说有70列x1700多行,如何找到并且去掉全是零的行? X[which(rowSums(X) > 0),]
W11YA
2019-04-22
1.创建变量x记录5个人的名字(Michael,John,Jane,Jack,Jorge),变量y1记录数学成绩(45,65,85,95,75),y2记录语文成绩(95,85,75,64,35),y3记录英语成绩(35,65,75,95,80);用不同方法将第二个人的数学成绩改为原成绩 5分(尽可能多种方法)。 2.将三门功课的成绩组成一矩阵,基于这个矩阵,计算每门功课的平均成绩z1和每个人的总
W11YA
2019-04-22
想要在garch模型中添加像 alpha1=2alpha2 这样的约束: 遇到一个garch模型的误差回归为 h(t)=alpha0 alpha1(0.4e^2(t-1) 0.3e^2(t-2) 0.2e^2(t-3) 0.1e^2(t-4)) 所以想到的是做一个 h(t)=alpha0 alpha1e^2(t-1) alpha2e^2(t-2) alpha3e^2(t-3) alpha4e^2
W11YA
2019-04-22
比如说,教育程度有:小学、初中、高中、大学,满意度有:差、较好、好、最好。这样的变量如何用r变为数值变量。 df <- data.frame(v1=rep(c("小", "中", "大"),each=4), v2=rep(c("满意", "一般", "很差"),times=4)) new_var <- plyr::mapvalues(df$v1,
W11YA
2019-04-22
> dstats <- function(x)(c(mean=mean(x), sd=sd(x))) > by(mtcars[vars],mtcars$am, dstats) Error in is.data.frame(x) : (list) object cannot be coerced to type 'double' In addition: Warning message
W11YA
2019-04-22