你可以使用pandas / python连接基于第2行的.xlsx文件的文件夹吗？

我无法使用pandas连接一个非常大的.xlsx文件文件夹。问题是我们有一些文字写在每个文档的第一行，无法删除。

我的文件夹的path设置和连接工作。问题出在第一个文件之后，当连接其余文件时，它将删除前两列中的ID＃。所以不仅数据不匹配每列，但我也失去了我的唯一标识符。我最好的猜测是这是由于每个文档中的第一行文本。

这是我迄今为止。

files = [f for f in os.listdir(path) if f.endswith('.xlsx')] iep_boy_df = pd.concat([pd.read_excel(os.path.join(path, f), sheetname='Academic Outlier List', encoding='utf-8') for f in files], keys=files, names=['File Name', 'Row']).reset_index()

我已经看到了一些使用Pythonparsing文件的方法，但是你可以parsing50个以上的excel文档来跳过第1行，然后将它们传递到pandas中以转换成DF？总而言之，我想第1行被排除在串联之外。

这里仍然是一个Python的中间，所以任何帮助将不胜感激！

我不确定这是否会完全解决您的导入问题，但是Pandas read_excel()有一个可以跳过第一行的skipped_rows参数。请注意，它的types是一个零索引列表。

参考： http : //pandas.pydata.org/pandas-docs/version/0.20/generated/pandas.read_excel.html

我会回应piRSQUARED的答案。 pd.read_excel有skiplude，但记得要跳过行作为一个迭代。

你可以使用pandas / python连接基于第2行的.xlsx文件的文件夹吗？

Excel 2010 – 形状超链接指向单元格文本URL

使用PHP将数据从SQl导出到Excel

导出为Excel格式

在ms excel中查找Max和Return列名

如何将html表格导出为excel和分页

Java Date在excel页面导出时出现问题

ssrs报告导出为excel（公式）

拆分不工作的Excel VBA

无法使用EPPlus删除工作表

导入一个excel文件到delphi的datagrid

你可以使用pandas / python连接基于第2行的.xlsx文件的文件夹吗？

Excel 2010 – 形状超链接指向单元格文本URL

使用PHP将数据从SQl导出到Excel

导出为Excel格式

在ms excel中查找Max和Return列名

如何将html表格导出为ex​​cel和分页

Java Date在excel页面导出时出现问题

ssrs报告导出为ex​​cel（公式）

拆分不工作的Excel VBA

无法使用EPPlus删除工作表

导入一个excel文件到delphi的datagrid

如何将html表格导出为excel和分页

ssrs报告导出为excel（公式）