Tag: r

在R / R工作室加载excel文件

我的问题是: 我能够使用read.csv读取文件,但read.table给我一个错误。 我也尝试了下面的代码,但没有阅读文件: read.table("hw1_data R programming.xlsx", header = TRUE, sep = ",") read.table("hw1_data R programming.xlsx", sep = ",") read.table("hw1_data R programming.xlsx", header = TRUE, sep = ",",fileEncoding='UCS-2LE') 我如何使用read.table ? 使用read.table比read.csv什么优点(或缺点),反之亦然? [我相信一点是: read.table不需要以csv格式保存文件,这是一般的情况。 我对吗?] 我GOOGLE了加载excel文件的方式,并findhttp://www.r-tutor.com/r-introduction/data-frame/data-import,http://www.statmethods.net/input/ importeddata.html并尝试安装gdata(还包括xlsx)。 最后能够加载文件。 但是我想知道,为什么我们需要安装像gdata / xlsx / etc … perl这样的软件包,如果我们可以简单地通过read.csv或者read.table来做同样的事情的read.csv 。 在read.table和read.csv上使用这些软件包有什么优势(或缺点),反之亦然?

读取打开的Excel文件

我正在尝试使用RODBC软件包中的odbcConnectExcel2007函数读取Excel文件。 当文件没有被使用时它工作正常。 但是,如果是这样,我得到的错误: 警告消息:1:在odbcDriverConnect(con,tabQuote = c(“[”,“]”),…):[RODBC]错误:状态HY000,代码-1028,消息[Microsoft] [ODBC Excel Driver] Can not打开数据库“(未知)”。 它可能不是您的应用程序识别的数据库,或者该文件可能已损坏。 2:在odbcDriverConnect(con,tabQuote = c(“[”,“]”),…):ODBC连接失败 我也尝试在函数说明中包含readOnly = TRUE ,但仍然没有运气。 任何想法的人?

在R或Excel中将date从3位数格式转换为Juliandate

我目前的date格式为mdd(单位或双位数月份和双位数字date),年份分列。 以下是数据的例子: Year Date 1996 921 1996 923 1996 1001 1996 1127 1997 502 我想结合这些,并将其转换为朱利安date。 谁能帮我这个? 我不知道为什么这些数据是以这种尴尬的格式收集的。 提前感谢您的帮助 – R或Excel的代码将会很好!

如何根据来自另一个data.frame的用户IDlogging为data.frame中的用户分配值

我已经读了R中的excel文件,其中sheet1有51500行和5列,工作表2有买家的用户ID(只有一列)。 目标 :旨在提取表单2中出现用户标识的表1中的用户。以下是两个示例input文件和所需的输出: df <- data.frame(User.ID=c(12: 17), Group="Test", Spend=c(15:20), Purchase=c(5:10)) df User.ID Group Spend Purchase 1 12 Test 15 5 2 13 Test 16 6 3 14 Test 17 7 4 15 Test 18 8 5 16 Test 19 9 6 17 Test 20 10 hash.ID <- data.frame(User.ID= c(13:16)) User.ID 1 13 2 14 3 […]

用MLE获得标准化T分布的自由度

首先,我感谢大家的阅读。 我试图用一系列的数据拟合一个标准化的T学生分布(即标准差为1的T学生) 那就是:我想通过最大似然估计来估计自由度。 我需要实现的一个例子可以在以下(简单)Excel文件中find: https : //www.dropbox.com/s/6wv6egzurxh4zap/Excel%20Implementation%20Example.xlsx?dl=0 在Excel文件中,我有一个图像,其中包含与标准化T学生分布的对数似然函数的计算相对应的公式。 该公式是从一本金融书籍(金融风险pipe理元素 – 彼得·克里斯托弗斯芬)中提取的。 到目前为止,我已经尝试过与R: copula.data <- read.csv(file.choose(),header = TRUE) z1 <- copula.data[,1] library(fitdistrplus) ft1 = fitdist(z1, "t", method = "mle", start = 10) df1=ft1$estimate[1] df1 logLik(ft1) df1产生数字:13.11855278779897 logLike(ft1)产生数字:-3600.2918050056487 但是,Excel文件的自由度为:8.2962365022727,对数似然为:-3588.8879(这是正确的答案)。 注意:我的代码读取的.csv文件如下所示: https : //www.dropbox.com/s/nnh2jgq4fl6cm12/Data%20for%20T%20Copula.csv?dl=0 有任何想法吗? 谢谢你们!

如何将R中table()的输出导出到Excel中

gen_start <- which(colnames(westpac)=="RespID") gen_end <- which(colnames(westpac)=="sc_frequency") for(i in gen_start:gen_end) { print(colnames(westpac[i])) print(table(westpac[,i])) } 是可以在Excel中导出表? 我已经尝试过使用count()函数,但它将variables名称显示为“x”,并且不可能在count()函数中单独重命名所有variables。 所以我想获取它的variables名称以及各种类别的频率。 我曾尝试导出表一次,但它只给了我的频率only.This是我如何试图导出输出在Excel表或类似的东西会有所帮助: [1] "QI1_15" 0 1 977 393 [1] "QI1_16" 0 1 1188 182 你们可以提出一些想法,或者有没有其他办法吗?

R的Excel虚拟variables

我希望这个问题不是题外话。 我知道如何在R中编写一个虚拟variables,但是,我想知道是否可以在Excel中创build它。 比方说,我有一个颜色variables下的3种颜色(红色,蓝色,黄色)列表。 R会把这个作为一个3级的因素导入。 现在,如果我想在Excel中做到这一点,我可以做出3个新的预测variables(而不是颜色,他们现在变成红色,蓝色和黄色),如果它是红色的,红色的列中放置1,否则为0,等等? 或者R会继续把这个解释为3个单独的因素,每个都有2个等级?

如何计算相同的值在R或Excel中连续出现的次数?

我有一个数据集,我试图分析相同的值连续出现多less次。 例如(基于以下数据):'1'从1/1 / 2000-1 / 3/2000'连续出现3次' 示例数据集 date, value 1/1/2000,1 1/2/2000,1 1/3/2000,1 1/4/2000,3 1/5/2000,3 1/6/2000,1 1/7/2000,3 1/8/2000,3 1/9/2000,3 1/10/2000,3 R或Excel应该如何处理这个问题?

Excel数据透视计数到R代码

我正在研究以下数据,并希望将我所做的Pivot复制到R中。我能够完成总和和最大值,但不知道如何进行计数。 感谢你的帮助 Transaction Location Invoice Paying_Party Charge Delivery Paid Points 123 UK 123_A UK001 1 1 100 123 UK 123_B UK001 1 0 100 123 UK 123_C UK001 1 1 100 124 UK 124_A UK001 1 1 100 124 UK 124_B UK001 0 0 50 125 SE 125_A SE005 0 0 50 126 HK 126_A […]

为什么Excel和R会给出不同的ANOVA输出?

我正在R中做一个简单的ANOVA,如下所示。 x1 <- c(180,45,45,200,65,150,380,250,0,0,320,100,80,0,280,20,60,300,210,0,20,0,0,260,220) x2 <- c(0,100,120,0,40,200,20,240,80,420,0,0,0,220,160,40,180,0,0,40,0,20,100,0,120) dat = data.frame(cbind(x1,x2)) colnames(dat) <- c("Column1","Column2") dat$Column2<-as.factor(dat$Column2) anova(lm(Column1~Column2,data=dat)) 这是我得到的输出。 Analysis of Variance Table Response: Column1 Df Sum Sq Mean Sq F value Pr(>F) Column2 11 181842 16531 1.2339 0.3548 Residuals 13 174164 13397 但是,当我使用“ANOVA:单因子”在Excel中执行相同的ANOVA时,我得到以下结果。