Tag: r

R:是否有相当于Stata的codebookout命令?

在Stata中,我可以使用codebookout命令创build一个Excel工作簿,该工作簿可以保存现有数据集中所有variables的名称,标签和存储types及其相应的值和值标签。 我想在R中find一个等价的函数。到目前为止,我已经遇到了memisc库,它有一个叫做codebook的函数,但是和Stata不一样。 例如,在Stata中,码本的输出看起来像这样…(见下面 – 这是我想要的) Variable Name Variable Label Answer Label Answer Code Variable Type hhid hhid Open ended String inter_month inter_month Open ended long year year Open ended long org_unit org_unit long Balaka 1 Blantyre 2 Chikwawa 3 Chiradzulu 4 即数据框中的每列被评估为产生5个不同列的值: variables名称是列的名称 variables标签这是列的名称 答案标签是列中的唯一值。 如果没有唯一的值,则认为是开放式的 应答码,是答案标签中每个类别的数字分配。 如果答案标签不是分类,则为空。 variablestypes:int,str,long(date)… 这是我的尝试: CreateCodebook <- function(dF){ numbercols <- […]

导出data.frame时不能强制R中的types

我想导出data.frame到excel和我的代码如下。 wb <- xlsx::createWorkbook() sheet_growth <- xlsx::createSheet(wb, sheetName="growth") 然后Rstudio报告 as.vector(x,“character”)中的错误:无法将types'environment'强制为types为'character'的向量 我已经很努力地弄清楚发生了什么事情。 但仍然无法解决。 任何想法都会有所帮助。 谢谢。

在R中创buildxls文件,并在列名称的顶部添加一个标题

我有几百个xls文件,其中有不正确的数据。 我需要打开他们进行更正并保存。 进行更正是一件小事,所以我已经为此编写了代码,诀窍是每个表都有一个从第3行开始的表,前两行包含合法标题。 我习惯于使用readxl包,但不提供保存电子表格的工具。 所以今天我一直在试验xslx包,但是我不太清楚如何使它工作。 在readr我能够使用以下内容来编写带有免责声明的csv文件: write_csv(Disclaimer, filepath,col_names = FALSE) write_csv(my.data.frame,filepath, col_names = TRUE,append =TRUE) 在xlsx这不起作用: write.xlsx(filepath,Disclaimer,"Sheet1",col.names = FALSE) write.xlsx(filepath,my.data.frame,"Sheet1",col.names = TRUE,append=TRUE) 这yeilds一个Java错误: java.lang.IllegalArgumentException:工作簿已经包含这个名字的一个表 所以我的问题是你怎么能写一个xls文件(或者xlsx而不是csv ),这样它的头部就在acutual表格的上方。 为了logging我的工作簿有两张纸,两张纸都有免责声明,但是它们包含不同的表格。 我真的希望我可以离开Excel文件,但我需要保持原来的格式。 另外,我打算使用其他软件包,但我不熟悉其他软件包(在我们讲话时重新研究XLConnect )。

将多个xl文件读入数据框

我一直在使用XLConnect函数loadworkbook将每个xlsx文件加载到R然后rbind将它们合并在一起。 这样做的最好方法是什么,而不是写多个DF来稍后合并它们。 我正在尝试使用下面的代码将我的Excel文件合并到2个数据框(大多数文件的2个工作表名称)。 列总是相同的,但文件名将会改变。 当前/缓慢的方式 require(XLConnect) df <- loadWorkbook(paste(location,'UK.xlsx',sep="")) dfb <- loadWorkbook(paste(location,'US.xlsx',sep="")) UK <-readWorksheet(df,sheet="School",startRow=0,startCol=0,autofitRow=TRUE,endCol=21,header=TRUE) US <-readWorksheet(dfb,sheet="School",startRow=0,startCol=0,autofitRow=TRUE,endCol=21,header=TRUE) School <- rbind(UK,US) UK <-readWorksheet(df,sheet="College",startRow=0,startCol=0,autofitRow=TRUE,endCol=21,header=TRUE) US <-readWorksheet(dfb,sheet="College",startRow=0,startCol=0,autofitRow=TRUE,endCol=21,header=TRUE) College <- rbind(UK,US) 新的代码 require(readxl) filelist<- list.files(location,pattern='xlsx',full.names = T)如果不是每个文件都具有sheetname,我怎样才能将每个sheetname读入数据框。 我需要2个数据框1为学校和1为学院。 我想我需要尝试像Schools <-lapply(filelist, read_excel, sheet="School")但我得到错误:表'学校'找不到。 我认为这个错误是因为表单学校不在每个文件上。 我正在使用list.files因为文件名不总是相同的。

如何使用Python创buildExcel文件的见解? 我是两种语言的初学者

我有一个大的Excel电子表格,它有一个组织的大量和大量的历史数据。 我希望能够阅读该excel文件,并从中创build有价值的见解。 我不希望任何人为我这样做,但我只是希望有人能指出我应该如何去做这个在Python / R或build议任何我可以访问的在线资源来完成这件事。

名称dataframe和.csv由第一个列标题/variables输出

新的R和编程一般,阅读一些似乎与此类似的其他职位,但我不能确定。 这是我想要做的 – 从Excel中导入数据,在Excel中第一列中的variables/列标题之后命名数据框,在R中执行统计testing,然后编写一个.csv输出,其文件名与原始Excel中的第一个variables/列标题(现在也与数据框名称相同)。 我有几百个需要通过循环估计的回归,并且需要保存的.csv输出具有唯一的文件名,以便我可以区分它们,所以我有一个名称为虚拟variables作为Excelinput中的第一列。 这对我的能力似乎是最简单的方式,所以我会很感激任何见解! 而且,如果其他人可以提出更简单的方法,那么这当然是最有帮助的。 谢谢!

如何将列向量转换为matrix的对angular线?

我有一个列向量,我想转换为对angularmatrix。 那就是我有向量v =(1,2,3)并且想把它变成: [1,0,0] [0,2,0] [0,0,3] 我怎样才能在Excel中做到这一点? 在R? 我不在乎我怎么做,我只需要把它做完。 我知道这是一个简单的问题,但我一直试图找出这个好几个小时。 (注:我的vector目前在一个CSV文件)

如何在R中将0转换为00?

你好? 我想问一个关于R代码的问题。 首先,这里是我的原始Excel数据,这是一个CSV文件。 在这里input图像说明 正如你可以看到这张照片,List_code和List_code_2中的零写在最前面。 但是,当我在R studio中加载CSV文件时,零消失。 我在R studio结果上添加一张照片。 在这里input图像说明 我想改变像Excel显示数字。 例如,需要将List_code中的“1475”和List_code_2中的“0”转换为“01475”和“00”,但是“45876”和“10”不需要更改表格。 我试过格式()函数,但它没有工作。 这是我的R代码。 Barcode <- read.csv("Fruit_barcode.csv", header=T) View(Barcode) format(Barcode$List_code, format="%Y") 如何更改R数据框中的代码编号forms? 我期待着看到一些答案。 非常感谢。

excel / TTR标准差的区别

使用TTR来计算2天的标准偏差。 我也在Excel中做了同样的事情。 他们都是一样的,除了TTR,我收到价值: 1.00485917355762E-14 在哪里excel有一个0的地方。 上述价值是什么意思? 什么东西提高到14的力量? 如果excel表示它应该是0,为什么我会看到这个,谁是对的? Close TTR package stdev, n = 2 Excel stdev, n = 2 43.79979 NA NA 44.04865 0.175970594 0.175970594 44.17308 0.087985297 0.087985297 44.54638 0.263962961 0.263962961 44.79524 0.175970594 0.175970594 44.79524 1.00E-14 0 44.79524 1.00E-14 0 44.42195 0.26395589 0.26395589 44.54638 0.087985297 0.087985297 44.79524 0.175970594 0.175970594 44.42195 0.26395589 0.26395589 43.30206 0.791881813 […]

如何使用R 来检查某个其他dataframe中某个dataframe的特定数据

我有两个dataframe叫做df1和df2,而df1有两列叫poi , score 。 另一个dataframedf2只有一列叫poi_ ,它包含了df1 $ poi中的一些常见数据。 我将需要检查哪些df2 $ poi_在df1 $ poi中定义了他们的分数,如果分数存在,则在df2中放入一个名为score_的新列,并用df1中的分数填充该列