啊啊啊啊啊吖

2018-10-24   阅读量: 882

数据分析师 Excel R语言

Excel与R联通的办法(不用RExcel)

扫码加入数据分析学习群

Rexcel是通过COM,而我介绍的方案是基于http协议,原理很简单,就是在R里设置一个http服务器,用VBA构建R代码或格式化数据,从Excel向R发送数据、代码,计算完毕返回结果,以VBA处理返回结果。Rexcel难安装,且也需要学习一些使用技术,对于实际应用而言,很多情况下未必有这个基于http协议的方法易用。强调一点,这里介绍的,是一个策略或方案,不是一个单一的办法,实现这个方案的技术不仅下述一种。

这个方案的难点在于R语言一端的server,见以下脚本,别看这个脚本没几行,为了攒起这个玩意,还真耗了不少搜索。

library(Rook)

library(R.utils)

setRefClass(

'FooBar',

methods = list(

    call = function(env) {

    result <- captureOutput(source(textConnection(rawToChar(env[['rook.input']]read())))value)

         list(

             status = 200L,

             body = paste(result,collapse="\n")

              )

                      }

                 )

             )

s<-Rhttpdnew()sstar(listen='127.0.0.1',port='11269')

sadd(name="response",app=getRefClass('FooBar')new())

几点说明:

1. 以上脚本可以实现的功能是:运行客户端发的R代码,捕捉输出,以文本格式返回客户端。这样就实现了以Excel为前端,以R为后端的效果。不过,不能返回图像。

2. 为什么选基于http的通信方式?Excel一端用WinHttpRequest发请求很容易,且可以与一个打开的R session反复通信;Clipboard我也试过,也很容易实现,但不知为什么容易出莫名其妙的故障;管道也试过,也不难,但在Windows下,很难实现一直守着一个打开的R session。

3. 本文介绍的以R为后端的通信方案仅可用作本地工具,不适合做网络应用开发,要想做开发,就必须用Shiny之类的了。

4. 上文中的脚本要求Rook包。R里能用来做server的工具不多,Rook是比较简易高效的一个,Linux和Windows下都没问题,还有个更小更快的httpuv,Linux下很好用,Windows下似乎总会导致R崩溃。

5. 向Rook服务器发送请求的长度上限为64kb,这个长度能做的事情还是不少的。

6. 上述代码中最为来之不易的是最长的那句,尤其是“env[['rook.input']]$read()”这部分,其功能是获得http请求中的原始input,Rook的官方说明里并没有给出说明,我是从其他包的源码中找到的这种方法。

7. 客户端以以下 VBA代码为例:

Private Sub CommandButton1_Click()

Dim REQ As New WinHttpRequest '引用Microsoft WinHTTP Services

REQ.Open "POST", "http://127.0.0.1:11269/custom/response/" '注意url后半段中的路径

REQ.Send ("citation()")

Debug.Print REQ.ResponseText

End Sub

8. 基于这个方案,可以利用R编程的优势,把一些复杂的计算过程或者Excel中没有的功能做成宏,提高效率。

上面强调过了,以http通信连接Excel与R只是一个策略而已,具体实现方法很多,再如用Python或Node.js等做一个数据中转用的服务器,在Excel做格式化数据的宏,实现在Excel中选取数据,将数据以文本方式发至中转服务器,R端从服务器读入数据,省去建立数据文件的麻烦。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 1 关注作者 收藏

评论(0)


暂无数据

推荐课程