在用boosting tree的时候,用distribution=“bernoulli”的时候出现错误: Bernoulli requires the response to be in {0,1}我想把因变量的YES和NO全部转化成1和0试试。 其实在R里可以一条代码实现: ifelse(y == "yes", 1, 0)
啊啊啊啊啊吖
2018-11-07
文件读入错误:
> read.csv(file="D:\\Data\\rd\\01.csv",header=TRUE)
错误于make.names(col.names, unique = TRUE) :
'
啊啊啊啊啊吖
2018-11-07
a 如上图所示, 想让同一个sub条件下,SD==1 条件下的 rating_indif2 减去 SD==0 条件下的rating_indif2, 这样,每一个sub,计算出一个差值。 另外需要注意,数据中SD==1 和SD==0的条件并不一定是固定的前后顺序 能不能不使用循环就能实现计算? 可以如下参考办法: df <- data.frame(sub=rep(26:28, each=2
啊啊啊啊啊吖
2018-11-07
R语言怎么把数据框每列分割成两列,然后合并成新的数据框? 比如数据如下: kk <- matrix(c("CG","CC","GG","GG","CG","CG","CC","CG","CG","CC","GG","GG"),3,4) kk <- as.data.frame(kk) 把每一列的字符串分割成两个字符,然后各自成为新的列,再进行合并。 library(stringr) split
啊啊啊啊啊吖
2018-11-07
###Brown-Mood中位数检验(精确检验,正态近似,连续性修正后的正态近似) BM.test=function(x,y,alt) #alt:备择假设形式 { xy=c(x,y) md.xy=median(xy) t=sum(xy>md.xy) lx=length(x[x!=md.xy]) ly=length(y[y!=md.xy]) lxy=lx ly A=s
啊啊啊啊啊吖
2018-11-07
(1) 收集数据:可以使用任何方法。 (2) 准备数据:距离计算所需要的数值,最好是结构化的数据格式。 (3) 分析数据:可以使用任何方法。 (4) 训练算法:此步骤不适用于k-近邻算法。 (5) 测试算法:计算错误率。 (6) 使用算法:首先需要输入样本数据和结构化的输出结果,然后运行k-近邻算法判定输 入数据分别属于哪个分类,最后应用对计算出的分类执行后续的处理。
啊啊啊啊啊吖
2018-11-07
k-近邻算法采用测量不同特征值之间的距离方法进行分类。 它的工作原理是:存在一个样本数 据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据 与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的 特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们 只选择样本数据集中前k个最相似的数据,这就是k-近邻算
啊啊啊啊啊吖
2018-11-07
NumPy函数库中存在两种不同的数据类型(矩阵matrix和数组array),都可以用于处理行 列表示的数字元素。虽然它们看起来很相似,但是在这两个数据类型上执行相同的数学运算可 能得到不同的结果,其中NumPy函数库中的matrix与MATLAB中matrices等价。
啊啊啊啊啊吖
2018-11-06
开发机器学习应用程序通常遵循以下的步骤。 (1) 收集数据。我们可以使用很多方法收集样本数据,如:制作网络爬虫从网站上抽取数据、 从RSS反馈或者API中得到信息、设备发送过来的实测数据(风速、血糖等)。提取数据的方法非 常多,为了节省时间与精力,可以使用公开可用的数据源。 (2) 准备输入数据。得到数据之后,还必须确保数据格式符合要求,本书采用的格式是Python 语言的List。使用这种标准
啊啊啊啊啊吖
2018-11-06
必须考虑下面两个问题: 一、使用机器学习 算法的目的,想要算法完成何种任务,比如是预测明天下雨的概率还是对投票者按照兴趣分组; 二、需要分析或收集的数据是什么。 首先考虑使用机器学习算法的目的。如果想要预测目标变量的值,则可以选择监督学习算法, 否则可以选择无监督学习算法。确定选择监督学习算法之后,需要进一步确定目标变量类型,如 果目标变量是离散型,如是/否、 1/2/3、 A/B/C或者红/黄/
啊啊啊啊啊吖
2018-11-06
监督学习的用途: k-近邻算法 线性回归 朴素贝叶斯算法 局部加权线性回归 支持向量机 Ridge回归 决策树 lasso最小回归 无监督学习的用途 K-均值 最大期望算法 DBSCAN parzen窗设计
啊啊啊啊啊吖
2018-11-06
使用R语言计算了SPEI和spi指数,将其保存为了.rdata格式,请问如何将.Rdata文件转换为txt格式或者xls,csv等? 在R或者Rstudio中操作: load(file="AAA.Rdata") # 路径自己指明 write(BBB,file="CCC.txt") #BBB 是加载Rdata后的对象名称
啊啊啊啊啊吖
2018-11-06
如何像打开csv格式的数据一样打开aa.Rdata? 谢谢!! 想查看全部的aa.Rdata中的数据, 因为这个数据有点多, 近百个变量, 近million行. aa=read.csv("aa.csv",header=TRUE,sep=",") aaa=save(aa,file="aa.Rdata") 数据量太大了, 用edit(card)
啊啊啊啊啊吖
2018-11-06
有个数据提取问题,描述如下: 图示为rdata里读取到的2012-2013年沪A数据 我的目标是,提取(每个股票 每个月)的头一个交易日和最后一个交易日所对应的数据 也就是红框里的这些行。 我知道得从第二列的date入手, 但是每个股票以及每个月的头一个交易日和最后一个交易日, 可能互不相同,没有固定日期 想麻烦高手们支个招,非常感谢 a 先把2012-01-29,分开year:2
啊啊啊啊啊吖
2018-11-06
想把我的数据进行一下转置,可是转置后,我的数据第一行的变量名称就变成数据了 library(tidyverse) long.jingji <- read.csv("C:\\Users\\lenovo\\Desktop\\csv\\中国宏观经济数据库-年度数据(全国).csv",check.names = F,header=T) new.jingji <-as.data.frame(t(l
啊啊啊啊啊吖
2018-11-06
安装建议用rstudio安装(可以自动安装依赖包比较方便) a 安装后在控制台输入ggplot_shiny() a 有四种方式打开此界面 1 ggplot_gui(你的 dataframe) 2 使用自带数据集 ggplot_shiny() 3 上传你的数据文件 a 4 粘贴一些数据(需要"tidy",依赖包里已包含) a 通过点击ggplot和plotly就可以制作图了(左侧 是数据参数
啊啊啊啊啊吖
2018-11-06
不管用R还是Python,然后是STL分解还是普通分解,分解出来画图是正常的,但是提取残差项和趋势项时全部是NA,只有季节项有数字,请问时怎么回事?可以怎么解决? python:用的seasonal_decompose a 分解后画图正常,但是提取时全是NA,R也是类似的 a a
啊啊啊啊啊吖
2018-11-06
console: 将光标定位到控制台 Ctrl 2 Ctrl 2 清空控制台 Ctrl L Command L 将光标定位到行首 Home Command Left 将光标定位到行末 End Command Right 在历史命令中导航 Up/Down Up/Down 弹出历史命令框 Ctrl Up Command Up 中断当前命令的执行
啊啊啊啊啊吖
2018-11-05
啊啊啊啊啊吖
2018-11-05