在R编程的一列中提取含有“string”数据的行

Excel文件包含数字，字母和字母数字的许多列。

Column1 Column2 column2 1 1 abcd fm1 2 2 bcde fm2 3 3 cdef fm3 4 4 aced fm4 5 5 cadf fm5

我已经在R中导入了文件

 data1 <- read.csv("Test1.csv")

现在要在R编程的第2列中提取包含“cd”的数据的行。

 df <- structure(list(Column1 = 1:5, Column2 = c("abcd", "bcde", "cdef", "aced", "cadf"), column2 = c("fm1", "fm2", "fm3", "fm4", "fm5" )), .Names = c("Column1", "Column2", "column2"), class = "data.frame", row.names = c(NA, -5L))

你可以使用grep

 df[grep('cd', df$Column2),]

数据

 df <- structure(list(Column1 = 1:5, Column2 = c("abcd", "bcde", "cdef", "aced", "cadf"), column2 = c("fm1", "fm2", "fm3", "fm4", "fm5" )), .Names = c("Column1", "Column2", "column2"), class = "data.frame", row.names = c(NA, -5L))

我所维护的包中的qdap中的Search函数使得这个任务非常简单：

 library(qdap) Search(df, "cd", 2, 0) ## Column1 Column2 column2 ## 1 1 abcd fm1 ## 2 2 bcde fm2 ## 3 3 cdef fm3

第一个参数是data.frame，第二个术语，可选的第三个参数是列名或数字，第四个是string距离，因为函数默认为模糊匹配。使用0使其完全匹配。

在看到上面的@akrun提供的答案之前，我把它们放在一起：

  #Data dF <- structure(list(Column1 = 1:5, Column2 = c("abcd", "bcde", "cdef", "aced", "cadf"), column2 = c("fm1", "fm2", "fm3", "fm4", "fm5" )), .Names = c("Column1", "Column2", "column2"), class = "data.frame", row.names = c(NA, -5L)) #Find rows with the string "cd" in the second column of the dataFrame 'dF' rows <- grep("cd", dF$Column2, ignore.case = F) #Display those rows dF[rows,]

grep()函数 – 和它的表兄弟 – 很简单，一旦你得到正则expression式的诅咒，它是非常强大的。

在R编程的一列中提取含有“string”数据的行

数据

更新单元格，自动将行复制到单独的工作表

如何在VBA中将string读入logging集

使用VBAsearch范围的值，并让它作为variables返回值的列

Excel FORMULA：查找单元格中的所有字符是否在另一个单元格中，即使在另一个单元格中它们是多个字符

如果在Excel中使用其他梯形图对数据进行sorting

使用VBA合并具有多个工作表的多个工作簿

MySQL ODBC在Excel VBA中显示小数为空

使用正则expression式和vba，提取部分数据

我意外地创build了一个vba竞赛条件？

将货币数据types转换为string并添加一些前导零