如何保存to_excel()和read_excel()之间的pandas多指数?
根据read_excel的pandas文档,我可以将索引列名称放在一个单独的行上,然后该方法将使用哪些列作为索引。
我想从一个多索引的数据框中创build一个Excel文件,这个数据框可以这样读取,但是我不知道如何让大pandas写入to_excel ,使得这个额外的行被创build索引dataframe)。
我无法想象将一个多索引的数据框存储为一个Excel工作表,然后在以后把它拉回来是一个罕见的用例,所以我想知道如果我只是没有想出如何做到这一点。
下面是一个我想在Excel中“冻结”的数据框的示例,而不必告诉read_excel哪些列是索引:
ipdb> my_df Date Amount Rec Section Row 0 Top Section 2 2015-05-01 -105.00 1 Middle Section 3 2015-05-04 90247.60 2 Middle Section 4 2015-05-05 -2992.99 3 Bottom Section 5 2015-05-08 -800.00
在我的例子中,有三个索引列:Rec,Section和Row。
当我把这个写到Excel然后再读回来,我不想告诉它这个。 由于read_excel似乎有一个方法,当它们出现在一个单独的行上时,推断索引名称,我想让它找出它(假设我正确地写入Excel文件)。
我错过了什么?
试图将透视表写入Excel时遇到同样的问题。 我能够通过修改frame.py
中的frame.py
文件来实现../pandas/core
。 更改if self.columns.nlevels > 1
, if self.columns.nlevels > 1 and not index
得到我所需要的。
由于这个function仍然不被Pandas
支持,你可能仍然会遇到有趣的输出。 此外,这可能不会解决read_excel
的问题。 希望这会有所帮助!
我在他的GitHub评论中引用了“onesandzeros”。