Tag: r

将数据从Excel加载到R – 第一列中出现的额外date?

在我尝试从Excel加载数据到R: > book <- loadWorkbook(file.choose()) > signals = readWorksheet(book, sheet = "signals", header = TRUE) > signals 它返回: time signal1 signal2 1 1899-12-31 08:30:00 0.43 -0.20 2 1899-12-31 08:31:00 0.54 0.33 3 1899-12-31 08:32:00 0.32 -0.21 为什么我要1899-12-31这个专栏? 这些绝对不在Excel表格中。 其余的是正确的。

如何将多文件.xlsx数据导入没有级别的单R数据框?

我试图从这里提供的免费纳斯达克100个Twitter数据集中提取每个公司的数据。 最终的目标,一旦构build和策划,就是用数据框进行一些模拟实验。 我想要的基本数据框表单是: ATVI 49.02 0.44 0.91 7193022 .3 ADBE 119.91 0.31 0.26 1984225 .1 AKAM 64.2 0.65 1.02 1336622 .1 ALXN 126.55 0.86 0.67 2182253 .2 GOOG 838.68 3.31 0.4 1261517 1.0 AMZN 853 2.5 0.29 2048187 1.0 对于每个公司,有六个.xlsx文件(解压到单独的目录中),每个excel文件包含多个工作表。 目前,我只是试图从每个公司的六个Excel电子表格中提取第一个工作表。 所有这些工作表都有两列,行数各不相同,数据标签位于不同行,例如文件1,公司1: Keyword $AAPL – Total tweets 166631 Total audience 221363515 Contributors 42738 Original tweets […]

曼 – 惠特尼U检验与p值

我想做一个Mann-Whitney U检验,比较第2,3,4列与第5,6和7列,并得到每行的p值来评估重要性。 type Sp1 Sp2 Sp3 Sp4 Sp5 Sp6 GH1 4 4 4 2 2 0 GH2 7 7 7 4 8 4 GH3 13 17 16 10 16 10 GH5 9 10 10 11 10 6 GH6 0 0 0 0 0 0 GH7 1 1 1 1 1 0 GH9 0 0 1 […]

R的外部和?

我只是R的初学者,但到目前为止找不到解决scheme。 我怎样才能创build一个这样的两个向量matrix? 在Excel中,这是完全简单的,但我怎么能在R中做到这一点? A = c(10,15,30) B = transpose(A) –> the transposed matrix of A => 10 15 30 我也想做一下计算:A /(A + B) – > 10 /(10 + 10)= 0.5; 15 /(15 + 10)= 0.6等等。 所以,我最终得到这样的结果: 10 15 30 10 0.5 0.6 0.75 VResult = 15 0.4 0.5 0.66 30 0.25 0.33 0.5 我需要将这个简单的例子应用于32位数的Vector,所以我需要一种计算方法。 然后应该保存新的matrix。 […]

根据列(部分匹配或逗号分隔列)合并两个表?

我有两个表格,他们的共享列不完全匹配(在资本结构的差异或像逗号,空间和一些文字的存在…)。 我怎样才能合并这两个表基于他们的共享列(在R,Knime,Excel功率查询或SQL)?

需要根据date和名称(使用循环?)创build运行计数(从1开始)

我有一个如下所示的数据集: Employee Id|Date|Hours|Points —————————– 有几百名员工,每个人有几十个不同date的行(以及相关的小时和分)。 我需要写一些能为每个员工分配一个工作天数的东西。 它将从第一天的第一天(根据他们工作的最早date)开始,然后继续,直到他们没有更多的日子工作。 我也需要创造一个总分。 基本上我需要它看起来像这样: EmployeeId|Date|Hours|Points|Cumulative_days_worked|Cumulative_points_total ————————————————————————— 我甚至不知道从哪里开始。 任何人都可以指向正确的方向吗? 谢谢

如何读取Excel文件作为数据框

我正在试图用国际货币基金组织的一些数据做一些情节。 我试图用read.table()读取xls文件: base <- read.table("http://www.imf.org/external/pubs/ft/weo/2017/02/weodata/WEOOct2017all.xls", header=TRUE, sep="\t", fill=TRUE) 但是,数据保存为列表: typeof(base) [1] "list" 而且我不知道如何提取数据来制作一个barplot。 例如,我想为variables“NGDP_RPCH”绘制“ARG”国家和2010-2019年(excel中40-49列)的variables。 我试过这个,但没有奏效: graph <- base[which((base[2]=="ARG")&(base[3]=='NGDP_RPCH')),40:49] graph [1] X2010 X2011 X2012 X2013 X2014 X2015 X2016 X2017 X2018 X2019 <0 rows> (or 0-length row.names) 我想知道如何将数据保存为数据框,或者如何从列表中提取数据的vector,所以我可以运行: barplot(graph).

有没有办法阻止Excel自动强制我的string从R内的date?

在R中,我有一个stringID,格式如XX-XX ,其中XX是01和99之间的任何整数。 但是,当string的数字可能类似于date时,Excel将自动强制执行此更改。 我使用write.csv()直接从R中写入.csv文件。 不幸的是,我无法改变ID格式约定,而且我也要求从R内部控制这个约束,因为这是一个非常大的自动化过程的一小部分,在这个过程中,使用软件的人不一定理解这个机制。 而且,对每个使用这个系统软件的人configurationexcel是不可取的,但是将其视为最后的手段。 这可能吗? 如果可以提供解决scheme,我愿意使用xlsx包等不同的写入选项。 MWE提供: # Create object with digits that will provoke the problem. ID <- data.frame(x = '03-15') # Write object to a csv file within the working directory. write.csv(ID, file = 'problemFile.csv') # Now open the .csv file in excel and view the result.

用R从多个excel文件中提取某些数据

我从多个Excel文件导入我的数据到R,我的数据看起来像R(每天可能有超过100个文件): > data [[1]] ST Code Emp Employee Pay.Code Hours Gross 1 AL 7229 65 S HOURLY 0.00 0.00 2 AL 7229 65 S SALARY 0.00 3060.00 3 AL 7229 65 S PER DIEM 0.00 765.00 4 AL 7229 65 S EXPENSE REIMBURSEMENT 0.00 11.00 5 CA 42 2 R HOURLY 60.00 720.00 6 CA […]

从Excel中读取date

我在Excel表中有两个date(在Excel中格式为dd-mm-yyyy)列。 Date Delivery Date Collection 06-08-17 15-08-17 11-04-17 15-04-17 24-01-17 24-01-17 11-08-16 14-08-16 有很多问题。 目前我正在读取数据的一个子集(手动由另一个Excel表中的前100行组成)。 在Excel中相同格式的date在R中以不同的方式显示。 当我读取整个数据集时,它们都像Data.Collection一样。 data <- read.xlsx("file.xlsx", sheetName='subset', startRow=1) R中显示的数据输出是 。 我需要将它们全部显示在Data.Delivery中,因为我需要在分析后将结果写回。 我也试图在R使用date dates <- data$Date.Delivery as.Date(dates, origin = "30-12-1899",format="%d-%m-%y")