用pythonparsingexcel文档

我想parsingexcel文件到Python列表。 有没有一个有助于这个行动的Python库? 那个库里有什么函数是相关的?

你最好的parsingExcel文件将是xlrd库。 python-excel.org网站有xlrd和相关python excel库的链接和例子,包括一个pdf文档 ,它有一些很好的使用xlrd的例子。 当然,在StackOverflow上也有许多相关的xlrd问题可以使用。

与xlrd库的一个警告是,它只能使用xls (Excel 2003和更早版本的Excel)文件格式,而不是更新的xlsx文件格式。 有一个较新的库openpyxl处理xlsx ,但我从来没有使用它。

更新 :按照John的评论, xlrd库现在支持xlsxlsx文件格式。

希望有所帮助。

xlrd对于简单的任务来说非常棒,但是如果你需要使用Excel的深层function(macros,高级绘图等等),而且你正在使用Windows机器,你可以使用pywin32库来控制win32com层。 这提供了访问几乎所有可以通过macros/ Visual Basic控制的内容。

openpyxl是一个伟大的库,并支持读/写到2010 xlsx文件。

示例parsing代码

 from openpyxl import load_workbook wb = load_workbook('Book1.xlsx') ws = wb.active for row in ws.iter_rows(): for cell in row: print cell.value 

pandas图书馆有一个快速和简单的方法来阅读excel。 如果它主要是数据,没有太复杂的,它将工作:

 import pandas as pd ex_data = pd.read_excel('excel_file.xlsx') 

它读入一个pandas数据框 ,这对于数据pipe理非常方便。

去一个清单:

 ex_data['column1_name'].values.tolist() 

如果您在每个工作表中有多个表和东西,那么您可能需要使用另一个库。

如果你想parsingxlsx尝试python-xlsx

pyExcelerator似乎不再被维护,但我已经使用了很长一段时间,并已经真正喜欢它。

关键点:

  • 平台无关
  • 不需要安装Excel(意思是不是我们的COM通讯)

更新

我所有的新项目都转移到了xlrd。