登录
首页精彩阅读R语言处理Excel文件
R语言处理Excel文件
2017-06-18
收藏

R语言处理Excel文件

Microsoft Excel是使用最广泛的电子表格程序,其存储数据在 .xls 或 .xlsx 格式。R能够直接使用一些 excel 特定的软件包,来从文件中读取数据。很少有这样的包 - XLConnect,XLSX,GDATA等。我们将使用XLSX包。 - R语言也可以使用该软件包写入 Excel 文件。

安装XLSX包

可以使用下面的命令在R控制台来安装“XLSX”包。 它可能会要求安装一些额外的软件包此程序包依赖。按照所需的软件包名称的相同的命令来安装额外的软件包。

install.packages("xlsx")

验证并载入“XLSX”包

使用以下命令来验证并加载“XLSX”包。

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

当脚本运行,我们得到如下输出。

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

输入为XLSX文件

打开Microsoft Excel中。复制并粘贴以下数据到名为工作表Sheet1工作表中。

id    name      salary    start_date    dept
1    Rick      623.3        1/1/2012    IT
2    Dan      515.2        9/23/2013    Operations
3    Michelle  611        11/15/2014    IT
4    Ryan      729        5/11/2014    HR
5    Gary      843.25    3/27/2015    Finance
6    Nina      578       5/21/2013    IT
7    Simon      632.8        7/30/2013    Operations
8    Guru      722.5        6/17/2014    Finance

下面的数据也复制并粘贴到另一个工作表,并重新命名该工作表为:“city”。

name     city
Rick     Seattle
Dan     Tampa
Michelle Chicago
Ryan     Seattle
Gary     Houston
Nina     Boston
Simon     Mumbai
Guru     Dallas

Excel 文件保存为“input.xlsx”。应该将其保存在R工作空间的当前工作目录。

读取Excel文件

所述 input.xlsx 通过使用 read.xlsx()函数来读取,如下所示。结果被存为数据帧。

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

当我们上面的代码执行时,它产生以下结果:

  id     name salary start_date       dept
1  1     Rick 623.30 2012-01-01         IT
2  2      Dan 515.20 2013-09-23 Operations
3  3 Michelle 611.00 2014-11-15         IT
4  4     Ryan 729.00 2014-05-11         HR
5 NA     Gary 843.25 2015-03-27    Finance
6  6     Nina 578.00 2013-05-21         IT
7  7    Simon 632.80 2013-07-30 Operations
8  8     Guru 722.50 2014-06-17    Finance

数据分析咨询请扫描二维码

客服在线
立即咨询