在pandas表开始之前的数据

我正在使用pandasparsing一个20k行数据表的Excel文件。到目前为止这么好，但是在表的起始位置还有一小部分元数据，我也想使用它（生成表的date）。

目前如果我不跳过任何行：

raw = pd.read_excel(datafile, sheetname=0, parse_cols="B, D:I")

前几行只是nans：

 >>> raw.values[0] array([nan, nan, nan, nan, nan, nan, nan], dtype=object)

我可以用像xlrd这样更基本的文件来打开这个文件来获取这些数据，但这需要将整个文件加载到内存中两次，而我却不想这样做。

pandas可以在不重新导入文件的情况下获取表格上方的数据吗？

考虑以下方法：

 xl = pd.ExcelFile(filepath) # you may want to set a correct row and column meta_data = xl.book.sheet_by_index(0).cell_value(0,0) skiprows = 5 # set it accordnigly... df = xl.parse(0, skiprows=skiprows, parse_cols="B, D:I") \ .dropna(axis=1, how='all')

Excel单元格与C＃格式更改
“对象variables未设置”错误
VBA从Outlook导出某些数据到Excel运行，但什么都不产生？
VBA Excel，基于单元格值重命名工作表
为什么我的Excel文件不能在href标签中下载？
VBA：多个用户表单引用相同的代码
尝试比较列a中的细胞和列b vba中的细胞
问题插入页脚在Excel中 – OpenXML
如何将Excel列表自动重新格式化为matrixforms？

在pandas表开始之前的数据

Excel VBA：中断代码执行（而不是按'转义'）

尝试操作失败错误

通过.Net客户端的OleDB引用的Excel值

EXCEL – 每个类别的CountIF

使用Visual Basic从Internet Explorer中提取类中的值

将MS转换为秒

VBA Sendmail通过Outlook使用单元格引用

VBA删除行删除工作表中的所有内容

Excel数据映射

使用“条件格式”突出显示基于相邻单元格的单元格，但仅当格式化的单元格为空白时才可以