从Excel中读取数据并忽略python中的空行

这可能是愚蠢的,但我需要从Excel中导入一些数据,其中数据打印在工作表中的某处(不是从A1位置开始)。

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... Timestamp abcd ... ... ... ... ... 20/01/2016 4.3 3.2 0.3 1.3 ... ... ... ... ... 19/01/2016 2.2 3.4 5.5 7.2 ... ... ... ... ... 18/01/2016 4.4 2.3 3.4 5.01 

我唯一的信息是数据从Timestamp所在的地方开始(可能在Excel表中的任何地方)。 它以我在这里介绍的格式显示。 我使用了两种不同的方法。 从xlrd我已经实现了下面的代码

  items = [] for row in range(d_sheet.nrows): for col in range(d_sheet.nrows): items.append(d_sheet.cell(row,col)) return items 

也使用pandas

  data = pd.read_excel('file.xlsx') data.as_matrix() 

在这两种情况下,我都会得到许多带有NaN值的空白行。 我想一个简单的解决scheme是运行该文件,并findTimestamp元素,并从该位置打印到我的文件。 但我想知道是否有任何其他的解决scheme,自动识别在Excel表格中打印数据的位置。

ps理想情况下,我想以DataFrame或字典格式存储数据,这样我就可以在我的代码中使用索引和列信息。

在这两种情况下,我都会得到许多带有NaN值的空白行。 我想一个简单的解决scheme是运行该文件,并findTimestamp元素,并从该位置打印到我的文件。 但我想知道是否有任何其他的解决scheme,自动识别在Excel表格中打印数据的位置。

**一个简单的解决scheme是运行该文件并find时间戳**

没有其他出路。 如果你没有一个固定的元素时间戳记开始位置,你需要遍历整个文件并find元素,即使你有一个解决scheme,比如 – 从我的xls中删除所有的NaN数据 – 在后面,这将会遍布整个文件。