将excel读入从第5行开始并包含标题的python数据框

如何将Excel数据导入python中的数据框。

基本上当前的Excel工作簿运行一些VBA开放刷新数据透视表,并做一些其他的东西。

然后我希望将数据透视表刷新的结果导入python中的数据框中以供进一步分析。

import xlrd wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm') #sheetnames print wb.sheet_names() #number of sheets print wb.nsheets 

刷新和开放的文件工作正常。 但是,我如何从第一行中的第一行select数据,包括标题向下到最后一个loggingn。

您可以使用pandas的ExcelFile parse方法来读取Excel工作表,请参阅io文档 :

 xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm') df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA']) 

skiprows将忽略前4行(即从第5行开始)和其他几个选项 。

被接受的答案是旧的(正如在接受的答案的评论中所讨论的)。 现在最好的select是使用pd.read_excel()