Tag: r

R评估论证的错误。 参数意味着不同的行数

我试图研究答案,我发现接近我的错误,但不够类似,以帮助我。 我的代码如下: setwd("Directory") require(XLConnect) wb <- loadWorkbook("workbook.xlsx") st = readWorksheet(wb, sheet = getSheets(wb)) summary(lm(X36~Temp.C., data=st)) 其中X36是Excel文件中的一列。 我得到的错误是: "Error in summary(lm(X36 ~ Temp.C., data = st)) : error in evaluating the argument 'object' in selecting a method for function 'summary': Error in data.frame(Info = list(Trial.. = c("Purpose: ", "Cure: ", "Cond: ", : arguments imply differing […]

将距离matrix作为matrix复制到R中的excel中

我有一个数据框(x)中的列,我想要使用dist(x$columnname)函数查找所有条目之间的成对距离。 输出是一个距离matrix,但如果我使用writeClipboard函数将数据复制到Excel中,我将得到所有成对距离的列表。 有没有办法,我可以复制到Excel保持matrix格式完好?

将excel文件读入R,并将其中的所有工作表合并到一个数据框中

我有一个不同数量的表格的Excel表(它可以有2张或3张或只是取决于用户)。 所有表格的标题都是一样的。 (前两行被认为是标题) 我想合并所有这些表单,并将其放入一个单一的数据框。 这些文件是.xlsx格式。 每张纸包含大量的行(30列和8000行)。 我是在R阅读excel文件的初学者。我正在通过他们,同时如果有人知道如何实现这一点,请让我知道。 Excel工作表的一个例子就是这样的数据 PS:我想实现这一切shiny。 所以,如果有任何有效的方法shiny请提及。 ui.R fileInput('file2', h5('Choose Your Observation Data'), accept=c('text/csv','text/comma-separated-values,text/plain','.xlsx')) server.R b <- reactive({ fileinput2 <- input$file2 if (is.null(fileinput2)) return(NULL) #xlfile <- list.files(pattern = ".xlsx") xlfile <- fileinput2[1] wb <- loadWorkbook(xl_file) sheet_ct <- wb$getNumberOfSheets() b <- rbindlist(pblapply(1:sheet_ct, function(x) { res <- read.xlsx(xl_file, x) }), fill=TRUE) b <- b […]

在R中读取Excel

在Excel中,我有一张如下所示的表格: ` Data Freq 1 [35-39] 1 2 [40-44] 3 3 [45-49] 5 4 [50-54] 11 5 [55-59] 7 6 [60-64] 7` 我试图找出能够读取“数据”列中的值作为R Project软件中的计算间隔的方法。 我需要把事情计算为: `(39-35)/2`

逗号,而不是与R的XLConnect和readWorksheet点

我正在使用XLConnect库来读取.xlsx数据以进行paneldata分析。 我的问题:如果读取数据框,我得到逗号而不是点作为小数点分隔符,我不知道为什么这是这种情况,我应该如何解决它。 我来自欧洲,但我在Excel中使用小数点。 重现一个例子是相当困难的,这里有重要的一行: wb = loadWorkbook("Bel_PANEL_DATA.xlsx") df_price <- readWorksheet(wb, sheet="Prices", keep=c(3,10)) colnames(df_price) <- c("Year", "Price") 一些随机线的输出是: Year Price 38 2000 175,1735 39 2001 196,2913 40 2002 204,3013 41 2003 251,2955 42 2004 259,8135 43 2005 265,1185 44 2006 370,9554 45 2007 367,2868 46 2008 339,0321 47 2009 348,6053 和… > typeof(df_price$Price) [1] "character" 如果我使用as.numeric我只能得到NA值(全部)…

在R的情节很多xls文件

我有一个文件夹,其中包含70个文件(在.xls格式)。 我想在R中编写一个脚本,它会从每个.xls文件绘制图表,并将其保存为单独的.jpg (或.png )文件。 可能吗? 给我一个提示?

在R中过滤分组数据

我想知道是否有人可以帮助分组下面的数据,因为我试图使用子集函数来筛选出低于某个阈值的卷,但是如果数据表示的是对象组,则会产生删除某些项目的问题被保存。 在F栏(和I)你可以看到蓝色,红色和黄色的物体。 每个代表一个DNA链上的三个独立的彩色探针。 奇数或无数蓝色,红色和黄色与由偶数编号的蓝色,红色和黄色表示的同源链配对。 即行2,3和4中的数据是一个“组”并且与行5,6和7中所示的“组”相对应。然后重复,所以8,9,10是一个新组,并且该组对与11,12,13。 我想要做的是将这些小组进行分组,以便只保留那些距离中点一定距离(列M)的小组。 这里的中点是连接一个组的蓝色和它的伙伴的蓝色的线的中点,所以这个子组只应用于蓝色距离到中点,这就是我遇到问题的地方。 例如,如果我要求保持到中点的蓝色距离小于3,那么第3行和第4行中的对象应该保留,因为它们是蓝色距离小于3的组的一部分。现在虽然当我用子集function我失去了红色select和黄色select。 我相信在R中有一个直接的解决scheme,但是如果有人通过这条路线有任何build议的话,我也可以在excel中进行一些types的过滤。 编辑我设法在发布问题后昨晚在Excel中工作。 解决scheme不是很漂亮,但它工作得很好。 我刚刚在“到中点的距离”旁边添加了一个新的列,使得一个组中的所有对象具有相同的距离,所以当我过滤数据时,我不会丢失任何不应该的对象。 如果以后有人帮助,我在Excel中使用的公式是: =SQRT ( ((INDEX($B$2:$B$945,1+QUOTIENT(ROWS(B$2:B2)-1,3)*3))- (INDEX($O$2:$O$945,1+QUOTIENT(ROWS(O$2:O2)-1,3)*3)) ) ^2 +( (INDEX($C$2:$C$945,1+QUOTIENT(ROWS(C$2:C2)-1,3)*3))-(INDEX($P$2:$P$945,1+QUOTIENT(ROWS(P$2:P2)-1,3)*3)) ) ^2 +( (INDEX($D$2:$D$945,1+QUOTIENT(ROWS(D$2:D2)-1,3)*3))-(INDEX($Q$2:$Q$945,1+QUOTIENT(ROWS(Q$2:Q2)-1,3)*3)) ) ^2)

将列从军事时间转换为标准时间

我试图将显示道路交通事故时间的列从军事时间转换为标准时间。 数据如下所示: Col1 Time..24hr. 1 1404 2 322 3 1945 4 1005 5 945 那么我想转换到12小时,所以'322'我想'3',例如。 非常感谢

什么是Excel IFERROR的R等价物?

我正在尝试把IFERROR条件放在像Excel IFERROR函数那样的R中。 我正在build立一个随机森林模型。 为了微调,我使用了tuneRF函数。 它有助于给出最佳的参数。 #Selecting Optimal MTRY parameter mtry <- tuneRF(dat3[, -36], dat3[,36], ntreeTry=1000, stepFactor=1.5,improve=0.01, trace=TRUE, plot=TRUE) best.m <- mtry[mtry[, 2] == min(mtry[, 2]), 1] 有时候,如果在不同的迭代中OOB错误不会得到改善,上面的函数会返回错误。 错误if(改进>改进){:缺less值,其中TRUE / FALSE需要。 下一步:如果上面的函数工作正常,我在下面的代码中使用best.m的值。 tuneRF函数中没有错误 – 运行下面的代码。 rf <-randomForest(classe~.,data=dat3, mtry=best.m, importance=TRUE,ntree=1000) tuneRF函数中的错误 – 运行下面的代码。 #Train Random Forest rf <-randomForest(classe~.,data=dat3, importance=TRUE,ntree=1000) 感谢预期! 任何帮助将不胜感激。

如何在R中使用具有特定行和列的循环读取多个xlsx文件

我必须读取具有随机名称的多个xlsx文件到单个数据框中。 每个文件的结构是一样的。 我只需要导入特定的列。 我试过这个: dat <- read.xlsx("FILE.xlsx", sheetIndex=1, sheetName=NULL, startRow=5, endRow=NULL, as.data.frame=TRUE, header=TRUE) 但是,这是一次只有一个文件,我不能指定我的特定列。 我甚至尝试过: site=list.files(pattern='[.]xls') 但之后循环不起作用。 怎么做? 提前致谢。