数据科学专业问答社区，好文章，一字千金--CDA答疑社区

监督学习和无监督学习有啥区别

监督学习，就是通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，最优则表示在某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就具有了对未知数据进行分类的能力。典型的例子就是KNN、SVM。无监督学习（或者叫非监督学习）则是另一种。它与监督学习的不同之处，在于我们事先没有任何训练

W11YA

2019-04-24

0.0000 0 2

怎么安装sk-learn

Scikit-learn 要求: Python (>= 2.7 or >= 3.3), NumPy (>= 1.8.2), SciPy (>= 0.13.3). 如果你已经有一个安全的 numpy 和 scipy，安装 scikit-learn 最简单的方法是使用 pip pip install -U scikit-learn 或者 conda: conda install scikit-

W11YA

2019-04-24

0.0000 0 3

R里面怎么进行相关性矩阵计算呢

首先要先导入数据 library(ggplot2) library(reshape2) > head(mydata) mpg disp hp drat wt qsec Mazda RX4 21.0 160 110 3.90 2.620

W11YA

2019-04-24

0.0000 0 3

怎么把数据导入到spss里呢

1、打开spss 2、点击这里的文件 3、下面有个打开，点击之后选择数据 4、然后要选择你要打开的数据类型然后查找文件就可以啦

W11YA

2019-04-24

0.0000 0 0

R语言中用什么函数进行替换好呢

sub()、gsub()和chartr() 这三个功能都是都是替换字符串。 sub和gsub参数都一样，例如：(pattern = , replacement = , text)，三函数区别是：sub只替换第一个符合条件的数据，gsub替换所有符合条件的数据，这两个函数都是把字符串作为一个整体替换；而chartr是对单个字符进行替换。 sub("a", "@", 'a1a2a3')

W11YA

2019-04-23

0.0000 0 1

r中怎么转换大小写

可以用这两个函数大小写转换：toupper()和tolower() text = "abcDEF" toupper(text) tolower(text) # [1] "ABCDEF" # [1] "abcdef"

W11YA

2019-04-23

0.0000 0 7

R里面tryCatch()是啥意思

tryCatch()本身是一个函数，不报错时返回第一个表达式的结果，如果警告或者报错就返回wanining或者error的函数返回值。无论如何，finnally中的表达式一定会执行，但不会作为tryCatch()的返回值。 result <- tryCatch({ }, warning = function(w){ }, error = function(e){ paste0('

W11YA

2019-04-23

0.0000 0 5

我对var函数的误解...

最近闲来无事，看R语言。学习过程中发现var()计算结果存在一定误差，如： x = c （2,4,6,8） var(x) = 6.666667 而我的计算结果是：5 查询相关资料发现：原来var()计算的是样本方差，而我计算的是总体方差。

W11YA

2019-04-23

0.0000 0 1

在R里seq函数咋用？

seq(from,to,length), 该函数的意思是生成一组数字，每个参数的意思是从from开始，到to结束，每两个数间的间隔是length,如 seq(2,10,2),会生成一组数：2 4 6 8 10 seq(from,to,length.out=by)表示生成一组从from到to的数量为num的数 by = ((to - from)/(length.out - 1))

W11YA

2019-04-23

0.0000 0 3

在R里这个函数是什么意思

在R语言中sample函数是什么意思呢比如这行代码 >sample(1:20,3) 这行代码的意思就是说，在1-20中间无放回的随机抽取3个数

W11YA

2019-04-23

0.0000 0 1

python里面怎么生成随机数捏

在 Python 中用于生成随机数的模块是 random，在使用前需要 import. 如下例子可以酌情列举： random.random()：生成一个 0-1 之间的随机浮点数； random.uniform(a, b)：生成[a,b]之间的浮点数； random.randint(a, b)：生成[a,b]之间的整数； random.randrange(a, b, step)：在指定

W11YA

2019-04-23

0.0000 0 1

在mysql数据库中建立库的小问题

首先在要先建立数据库然后使用数据库再进行建表，因为表是在数据库下的，所以要选择数据库才可以建立也就是说，我们在建表的时候， 1要看是否使用了数据库，2要看使用的数据库是不是想要建表的数据库

W11YA

2019-04-23

0.0000 0 1

安装oracle需要注意的一些小点

因为工作需要在好多电脑上安装了oracle数据库总结了几个小问题 1、首先在安装之前有两个长得很像的压缩包文件夹，要解压在同一个文件夹下！！（这个很重要敲黑板） 2、也是很小的问题但是需要注意，就是安装的路径中不能有中文，安装之前一定要检查一下，不然就会卡在那进行不了 3、安装磁盘要有足够的空间，不然安装过程中还是要清理就会很麻烦，还是建议提前清理

W11YA

2019-04-23

0.0000 0 2

excel界面都是英文怎么破

我们打开excel之后发现界面都是英文该怎么办呢 1、点开文件，找到选项点击 2、出来这个页面 3、再点击语言栏 4、然后把中文设置成默认语言，就可以啦

W11YA

2019-04-23

0.0000 0 2

Python的数值类型

python的数值类型很有意思：列表被称为打了激素的数值；元组里面的数不能改，可以作为函数传参；还是就是数据字典，包括键和数值；还有就是集合，集合里面的数据没有重复. list([X]) 转换为列表 set([X])集合 tuple([X]) 元组 dict([x])字典 str(X)字符串

W11YA

2019-04-22

0.0000 0 2

dataframe如何去掉全是零的行

r语言的data frame数据框，如果很大，比如说有70列x1700多行，如何找到并且去掉全是零的行？ X[which(rowSums(X) > 0),]

W11YA

2019-04-22

0.0000 0 0

关于R语言的错误

1.创建变量x记录5个人的名字（Michael，John，Jane，Jack，Jorge），变量y1记录数学成绩（45,65,85,95,75），y2记录语文成绩（95，85,75,64,35），y3记录英语成绩（35,65,75,95,80）；用不同方法将第二个人的数学成绩改为原成绩 5分（尽可能多种方法）。 2.将三门功课的成绩组成一矩阵，基于这个矩阵，计算每门功课的平均成绩z1和每个人的总

W11YA

2019-04-22

0.0000 0 1

garch模型添加约束的问题

想要在garch模型中添加像 alpha1=2alpha2 这样的约束：遇到一个garch模型的误差回归为 h(t)=alpha0 alpha1(0.4e^2(t-1) 0.3e^2(t-2) 0.2e^2(t-3) 0.1e^2(t-4)) 所以想到的是做一个 h(t)=alpha0 alpha1e^2(t-1) alpha2e^2(t-2) alpha3e^2(t-3) alpha4e^2

W11YA

2019-04-22

0.0000 0 2

R语言里如何对多个变量进行赋值

比如说，教育程度有：小学、初中、高中、大学，满意度有：差、较好、好、最好。这样的变量如何用r变为数值变量。 df <- data.frame(v1=rep(c("小", "中", "大"),each=4), v2=rep(c("满意", "一般", "很差"),times=4)) new_var <- plyr::mapvalues(df$v1,

W11YA

2019-04-22

0.0000 0 1

R中关于by的一个问题

> dstats <- function(x)(c(mean=mean(x), sd=sd(x))) > by(mtcars[vars],mtcars$am, dstats) Error in is.data.frame(x) : (list) object cannot be coerced to type 'double' In addition: Warning message

W11YA

2019-04-22

0.0000 0 0