python xlrd从excel文本单元格接收浮动

我正在尝试使用xlrd从Excel文件中读取值。 它一直在date,数字,直到现在的文字工作很好。 我有一个包含文本的单元格(类别)(单元格被格式化为文本)。 当我打印出单元格值时,会显示一个浮点数而不是文本。 我还打印出Cell对象的ctype来检查,它显示为Number。 我读过xlrd的文档和教程,似乎无法find为什么发生这种情况。 难道是我的Excel文件被搞乱了吗? 任何build议或指针在正确的方向?

import xlrd import datetime workbook = xlrd.open_workbook('training.xls') courseSheet = workbook.sheet_by_index(0) for row in range(courseSheet.nrows): title = courseSheet.cell_value(row, 2) date = courseSheet.cell_value(row, 4) date = datetime.datetime(*xlrd.xldate_as_tuple(date, workbook.datemode)) dateTuple = date.timetuple() category = courseSheet.cell_value(row, 7) print category 

背景:对于每个单元格,xlrd报告存储在XLS文件中的内在值(如果有的话)。 值types最初仅根据文件中的loggingtypes进行分配(例如,NUMBER和RKlogging包含浮点数)。 它按照这里所描述的格式对数据进行分类,并使用这些信息来覆盖值的types,在这种情况下,date时间,date或时间是显而易见的,而不是数字。 xlrd并不声称能够根据归于单元格的格式呈现单元格值。

有问题的细胞显然是作为数字input的。 如果他们有一个文本格式适用于他们,这不会使他们“文本单元格”。

你说“”“当我打印出单元格值时,会显示一个浮点数而不是文本”“”…请举例说明(a)创build文件时在单元格中input了什么内容(b)什么是(c)什么是repr(cell.value)(d)什么是您希望显示的“文本”?

你可能会发现下面的代码有用:

 import xlrd, sys def dump_cell(sheet, rowx, colx): c = sheet.cell(rowx, colx) xf = sheet.book.xf_list[c.xf_index] fmt_obj = sheet.book.format_map[xf.format_key] print rowx, colx, repr(c.value), c.ctype, \ fmt_obj.type, fmt_obj.format_key, fmt_obj.format_str book = xlrd.open_workbook(sys.argv[1], formatting_info=1) sheet = book.sheet_by_index(0) for rowx in xrange(sheet.nrows): for colx in xrange(sheet.ncols): dump_cell(sheet, rowx, colx) 

我和OP有同样的问题,我想我得出的结论是有些情况下python(xlrd)方面没有解决scheme。 数据最初是如何进入Excel表格的, 具体而言,如果数据input到已经应用了正确的“文本”格式的单元格中,或者数据是以默认的“常规”格式input到单元格中,则单元格的格式将更改为“数据input后的文本。

如果您将数据input到预先格式化的单元格中,则数字数据将标记为Excel警告标记,表示您在格式化为文本的单元格中包含数字数据。 在这种情况下,xlrd将按照您的预期处理数据 – 返回出现在Excel工作表中的string。 (例如,excel中的单元格内容为“1”,xlrd将单元格值返回“1”)

但是,如果在input数字数据后更改单元格的格式,则最终会出现以下情况:将excel中的数据显示为“1”,但xlrd将返回单元格值“1.0”。 如果您检查此单元格的xlrd cell.ctype,您将看到该单元格仍被视为一个数字,即使格式已更改为Excel中的文本。

一个可能的解决scheme可能是让您的Excelstring数据包围引号。 这将禁止excel从一开始就将数据视为数值。