用R从多个excel文件中提取某些数据

我从多个Excel文件导入我的数据到R，我的数据看起来像R（每天可能有超过100个文件）：

> data [[1]] ST Code Emp Employee Pay.Code Hours Gross 1 AL 7229 65 S HOURLY 0.00 0.00 2 AL 7229 65 S SALARY 0.00 3060.00 3 AL 7229 65 S PER DIEM 0.00 765.00 4 AL 7229 65 S EXPENSE REIMBURSEMENT 0.00 11.00 5 CA 42 2 R HOURLY 60.00 720.00 6 CA 42 2 R OVERTIME 3.25 58.50 7 CA 42 3 A HOURLY 80.00 800.00 8 CA 42 3 A OVERTIME 6.25 93.75 9 CA 42 4 N HOURLY 79.25 990.63 10 CA 42 4 N OVERTIME 7.00 131.25 11 CA 42 9 P HOURLY 32.00 352.00 12 CA 42 9 P OVERTIME 1.75 28.88 13 CA 42 10 E HOURLY 72.00 864.00 14 CA 42 10 E OVERTIME 5.00 90.00 [[2]] ST Code Employee Pay.Code Gross 1 AL 7229 NA NA 23954.0 2 AL 8380 NA NA 11092.1 3 GA 7380 NA NA 98142.0 4 GA 8380 NA NA 11984.0 5 NC 7380 NA NA 218129.0 6 NC 8380 NA NA 27891.0 7 TN 7380 NA NA 28441.0 8 TN 8380 NA NA 8348.0

现在我试图做的是获取code = "7229"作为一个单一的数据集，并导出到一个新的Excel文件，如下所示：

  > data ST Code Emp Employee Pay.Code Hours Gross 1 AL 7229 65 S HOURLY 0.00 0.00 2 AL 7229 65 S SALARY 0.00 3060.00 3 AL 7229 65 S PER DIEM 0.00 765.00 4 AL 7229 65 S EXPENSE REIMBURSEMENT 0.00 11.00 5 AL 7229 NA NA 23954.0 6 AL 8380 NA NA 11092.1

有没有更好的方法来做到这一点？

这应该做的伎俩：

 library(tidyverse) df_list %>% map_dfr(filter, Code == 7229) %>% write_csv(path = "/INSERT/PATH/HERE/text.csv")

以下是具有可重现示例的代码：

 df_1 <- tribble( ~ST, ~Code, ~Emp, ~Employee, ~Pay.Code, ~Hours, ~Gross, "AL", 7229, 65, "S", "HOURLY", 0.00, 0.00, "AL", 7229, 65, "S", "SALARY", 0.00, 3060.00, "AL", 7229, 65, "S", "PER DIEM", 0.00, 765.00, "AL", 7229, 65, "S", "EXPENSE REIMBURSEMENT", 0.00, 11.00, "CA", 42, 2, "R", "HOURLY", 60.00, 720.00, "CA", 42, 2, "R", "OVERTIME", 3.25, 58.50, "CA", 42, 3, "A", "HOURLY", 80.00, 800.00, "CA", 42, 3, "A", "OVERTIME", 6.25, 93.75, "CA", 42, 4, "N", "HOURLY", 79.25, 990.63, "CA", 42, 4, "N", "OVERTIME", 7.00, 131.25, "CA", 42, 9, "P", "HOURLY", 32.00, 352.00, "CA", 42, 9, "P", "OVERTIME", 1.75, 28.88, "CA", 42, 10, "E", "HOURLY", 72.00, 864.00, "CA", 42, 10, "E", "OVERTIME", 5.00, 90.00 ) df_2 <- tribble( ~ST, ~Code, ~Employee, ~Pay.Code, ~Gross, "AL", 7229, NA, NA, 23954.0, "AL", 8380, NA, NA, 11092.1, "GA", 7380, NA, NA, 98142.0, "GA", 8380, NA, NA, 11984.0, "NC", 7380, NA, NA, 218129.0, "NC", 8380, NA, NA, 27891.0, "TN", 7380, NA, NA, 28441.0, "TN", 8380, NA, NA, 8348.0 ) df_list <- list(df_1, df_2) df_list %>% map_dfr(filter, Code == 7229) %>% write_csv(path = "/INSERT/PATH/HERE/text.csv")

这使：

 # A tibble: 5 x 7 ST Code Emp Employee Pay.Code Hours Gross <chr> <dbl> <dbl> <chr> <chr> <dbl> <dbl> 1 AL 7229 65 S HOURLY 0 0 2 AL 7229 65 S SALARY 0 3060 3 AL 7229 65 S PER DIEM 0 765 4 AL 7229 65 S EXPENSE REIMBURSEMENT 0 11 5 AL 7229 NA <NA> <NA> NA 23954

尝试

 df = do.call("rbind", data)

然后，您可以将所有数据放在一个可以过滤的数据框中：

 df[which(df$Code == 7229),]

用R从多个excel文件中提取某些数据

从Excel表导入数据库表

Laravelvalidation器和excel文件错误

Excel – sorting数据仅在> 500时升序排除空白

查找符合条件的最新值

使用VBA通过C＃禁用在Excel中保存function

Excel VBA超出范围

python pandas read_excel返回describe（）上的UnicodeDecodeError

结合2文件夹文本文件的VBA Excel

将分隔的第二和第三列数据拆分为新的行

双击Excel中的单元格，在userform上打开该行的源文件