保存大xlsx文件pandaspython

我想连接20个excel文件到一个,并保存到Excel。 应该在一张纸上。 我的想法到目前为止是读取所有的文件到数据框,连接他们,并保存到Excel。 连接后,我有一个dataframe的形状是(1245226,20),在保存文件后,Excel中的大小是(1048576,20),磁盘上的大小是61MB。 下面我张贴我testing的方法来保存文件:

>> df.shape (1245226, 20) 

方法1 – 获取(1048576,20)而不是(1245226,20)

 writer = pd.ExcelWriter(path) df.to_excel(writer, index=False) writer.close() 

方法2 – 由于内存不足(16 GB RAM)无法保存文件

 writer = pd.ExcelWriter(path, engine='openpyxl') df.to_excel(writer, index=False) writer.close() 

方法3 – 获取(1048576,20)而不是(1245226,20)

 writer = pd.ExcelWriter(path, enigne='xlsxwriter') df.to_excel(writer, index=False) writer.close() 

任何想法如何保存? 也许有一种方法直接追加到excel文件的数据?

你不能。

Excel电子表格的最大尺寸为1,048,576行×16,384列。

资料来源: https : //support.office.com/zh-cn/article/Excel-specifications-and-limits-1672b34d-7043-467e-8e27-269d656771c3