Python和Pandas – 用相同的中断删除多个文件中的页脚

我正在对一组不同的excel文件进行数据分析，每个文件都有一个页脚。页脚的起点根据总行数而变化。页脚作为空白单元格从第一列开始，然后将文本的格式与列中其余数据不同。我正在试图find一个页脚长度variables，当我读取文件时，将放入skip_footer。

df looks like +--------------------+ | ABC | +--------------------+ | Data Data Data | | Data Data Data | | [Blank] | | This is | | The footer | | I need to remove | +--------------------+

我曾尝试在这个链接使用这两种方法，但我似乎无法得到任何工作。我得到的错误之一是无效的文件。我99％确定无效的文件即将到来，因为该文件是一个xlsx。当我打开并阅读文件时，只有当我尝试在其上运行function时，才会出现错误。

  Code: import os direct = "path" file = open(direct, "file name"), "r") import itertools as it def get_footer(file_): with open(file_) as f: g = it.dropwhile(lambda x: x != ' ', f) footer_len = len([i for i, _ in enumerate(g)]) return footer_len footer_len = get_footer(file)

我无法弄清楚如何做到这一点，但我有一个更容易的答案。

  import pandas as pd File = pd.read_excel() NoFooter = File[:-6]

Python和Pandas – 用相同的中断删除多个文件中的页脚

如何在Excel页眉/页脚中添加用户ID？

最后保存date在Excel工作表页脚

将页脚添加到Excel表集合

Excel 2013页眉和页脚自动删除“与”符号和括号

Excel Interop：格式化页脚