用pythonparsingexcel文档
我想parsingexcel文件到Python列表。 有没有一个有助于这个行动的Python库? 那个库里有什么函数是相关的?
你最好的parsingExcel文件将是xlrd库。 python-excel.org网站有xlrd和相关python excel库的链接和例子,包括一个pdf文档 ,它有一些很好的使用xlrd的例子。 当然,在StackOverflow上也有许多相关的xlrd问题可以使用。
与xlrd库的一个警告是,它只能使用 xls
(Excel 2003和更早版本的Excel)文件格式,而不是更新的xlsx
文件格式。有一个较新的库openpyxl处理 xlsx
,但我从来没有使用它。
更新 :按照John的评论, xlrd库现在支持xls
和xlsx
文件格式。
希望有所帮助。
xlrd对于简单的任务来说非常棒,但是如果你需要使用Excel的深层function(macros,高级绘图等等),而且你正在使用Windows机器,你可以使用pywin32库来控制win32com层。 这提供了访问几乎所有可以通过macros/ Visual Basic控制的内容。
openpyxl是一个伟大的库,并支持读/写到2010 xlsx文件。
示例parsing代码
from openpyxl import load_workbook wb = load_workbook('Book1.xlsx') ws = wb.active for row in ws.iter_rows(): for cell in row: print cell.value
pandas图书馆有一个快速和简单的方法来阅读excel。 如果它主要是数据,没有太复杂的,它将工作:
import pandas as pd ex_data = pd.read_excel('excel_file.xlsx')
它读入一个pandas数据框 ,这对于数据pipe理非常方便。
去一个清单:
ex_data['column1_name'].values.tolist()
如果您在每个工作表中有多个表和东西,那么您可能需要使用另一个库。
如果你想parsingxlsx
尝试python-xlsx
pyExcelerator似乎不再被维护,但我已经使用了很长一段时间,并已经真正喜欢它。
关键点:
- 平台无关
- 不需要安装Excel(意思是不是我们的COM通讯)
更新
我所有的新项目都转移到了xlrd。