为什么将数据导出为.xlsx比将.xls或.csv导出要慢得多?

我有一个数据框,我正在导出到Excel,人们希望它在.xlsx。 我使用to_excel ,但是当我将扩展名从.xls更改为.xlsx时,导出步骤大约需要9秒,而不是1秒。 导出到.csv甚至更快,我相信这是由于它只是一个特殊格式的文本文件。

也许.xlsx文件只是添加了更多的function,所以需要更长的时间写入,但我希望有一些事情可以做,以防止这种情况。

pandas默认使用OpenPyXL编写xlsx文件,该文件可能比用于编写xls文件的xlwt模块慢。

使用XlsxWriter作为xlsx输出引擎来尝试它:

 df.to_excel('file.xlsx', sheet_name='Sheet1', engine='xlsxwriter') 

它应该和xls引擎一样快。