read.xls不按预期方式运行
我有一个像这样的Excel文件(xls格式)
ab 10/06/2012 10/06/12 19:00 11/06/2012 11/06/12 05:30 11/06/2012 11/06/12 09:30 11/06/2012 11/06/12 10:00 11/06/2012 11/06/12 11:00 11/06/2012 11/06/12 11:30
我正在使用gdata库的read.xls函数将这个xls文件读入R.
data <- read.xls("data.xlsx")
但是当在R中打开这个文件时,我得到了这个
ab 41070 41070.79 41071 41071.23 41071 41071.40 41071 41071.42 41071 41071.46 41071 41071.48
我不知道这里发生了什么事。 当我使用read.csv读取转换后的csv文件时,正在正确读取文件。 有人可以告诉我有什么问题吗? 我正在Linux机器上工作。
尝试以R可读格式2014-11-25格式化date。 然后read.xls将正常工作。 如果您需要它在相同的格式尝试使用XLConnect。
Excel将date存储为数字: http : //office.microsoft.com/zh-cn/excel-help/about-dates-and-date-systems-HP005200674.aspx 。
你从Excel中得到的正是这些数字(从1900年1月1日到你的date过去的天数)。
将你的string保持为R的一种方法是先将它们转换成纯文本string。