RODBC读取错误,其中excel列包含主要的NAs

我一直在阅读Excel工作表到R使用RODBC包,并已与Excel ODBC驱动程序的问题。 包含(足够的)主要NAs的列被强制逻辑。

在Excel中,数据显示如下:

 period n n.ft n.pt 1/02/1985 0.008 NA 0.025 1/03/1985 -0.003 NA -0.024 1/04/1985 0.002 NA 0.015 1/05/1985 0.006 NA 0.012 1/06/1985 0.001 NA 0.003 1/07/1985 0.005 NA 0.010 1/08/1985 0.006 NA 0.001 1/09/1985 0.007 NA 0.013 1/10/1985 -0.002 NA 0.009 1/11/1985 0.013 NA 0.019 1/12/1985 -0.004 NA -0.021 1/01/1986 0.008 NA 0.009 1/02/1986 0.002 NA 0.009 1/03/1986 0.002 -0.003 1.000 1/04/1986 0.010 -0.003 0.041 1/05/1986 0.000 -0.001 -0.004 1/06/1986 0.005 0.003 0.005 1/07/1986 -0.003 0.005 0.012 1/08/1986 -0.001 -0.003 -0.021 1/09/1986 0.003 -0.001 0.012 1/10/1986 0.003 0.003 0.010 1/11/1986 -0.003 0.003 -0.003 1/12/1986 0.003 -0.003 0.022 1/01/1987 0.001 0.013 -0.004 1/02/1987 0.004 -0.004 0.011 1/03/1987 0.004 0.008 0.005 1/04/1987 0.000 0.002 -0.002 1/05/1987 0.001 0.002 0.006 1/06/1987 0.004 0.010 0.00 

我读了数据:

 require(RODBC) conexcel <- odbcConnectExcel(xls.file="C:/data/example.xls") s1 <- 'SOx' dd <- sqlFetch(conexcel, s1) odbcClose(conexcel) 

这将整个第二列读入NA 。 我认为这是由于它被推测是合乎逻辑的事实,因此随后的数字被评估为无效,因此被评估为NA

 > str(dd) 'data.frame': 29 obs. of 4 variables: $ period: POSIXct, format: "1985-02-01" "1985-03-01" ... $ n : num 0.00833 -0.00338 0.00157 0.00562 0.00117 ... $ n#ft : logi NA NA NA NA NA NA ... $ n#pt : num 0.02515 -0.02394 0.0154 0.01224 0.00301 ... 

我试图find一种方法来防止这种强制逻辑,我认为这是导致随后的错误。

我发现这个 Q + A通过searchSO,但是我在工作,并没有希望被允许编辑registry来改变默认的DWORD, build议 (我明白,这里设置的值决定了需要多lessNAs之前微软猜测的数据types和炸弹我读)。

现在,我认为最好的解决scheme是在Excel中反转数据,并将其上下颠倒读入。

我喜欢一个很好的黑客,但肯定有更好的解决scheme?

这不是一个错误,而是一个ODBC的特性(注意缺lessR)

http://support.microsoft.com/kb/257819/en-us

(长页面,检查“混合数据types”)。

由于使用ODBC读取Excel文件是相当有限的,我更喜欢Gabor提到的替代方法之一,偏好XLConnnect。