Python和Pandas – 用相同的中断删除多个文件中的页脚

我正在对一组不同的excel文件进​​行数据分析,每个文件都有一个页脚。 页脚的起点根据总行数而变化。 页脚作为空白单元格从第一列开始,然后将文本的格式与列中其余数据不同。 我正在试图find一个页脚长度variables,当我读取文件时,将放入skip_footer。

df looks like +--------------------+ | ABC | +--------------------+ | Data Data Data | | Data Data Data | | [Blank] | | This is | | The footer | | I need to remove | +--------------------+ 

我曾尝试在这个链接使用这两种方法,但我似乎无法得到任何工作。 我得到的错误之一是无效的文件。 我99%确定无效的文件即将到来,因为该文件是一个xlsx。 当我打开并阅读文件时,只有当我尝试在其上运行function时,才会出现错误。

  Code: import os direct = "path" file = open(direct, "file name"), "r") import itertools as it def get_footer(file_): with open(file_) as f: g = it.dropwhile(lambda x: x != ' ', f) footer_len = len([i for i, _ in enumerate(g)]) return footer_len footer_len = get_footer(file) 

我无法弄清楚如何做到这一点,但我有一个更容易的答案。

  import pandas as pd File = pd.read_excel() NoFooter = File[:-6]