为什么将数据导出为.xlsx比将.xls或.csv导出要慢得多?
我有一个数据框,我正在导出到Excel,人们希望它在.xlsx。 我使用to_excel
,但是当我将扩展名从.xls更改为.xlsx时,导出步骤大约需要9秒,而不是1秒。 导出到.csv甚至更快,我相信这是由于它只是一个特殊格式的文本文件。
也许.xlsx文件只是添加了更多的function,所以需要更长的时间写入,但我希望有一些事情可以做,以防止这种情况。
pandas默认使用OpenPyXL编写xlsx文件,该文件可能比用于编写xls文件的xlwt模块慢。
使用XlsxWriter作为xlsx输出引擎来尝试它:
df.to_excel('file.xlsx', sheet_name='Sheet1', engine='xlsxwriter')
它应该和xls引擎一样快。
- Excel RTD如何调用IRtdServer.DisconnectData()?
- Excel / ADO:访问logging集时出错
- Powershell – 将三个select语句输出到三个EXCEL工作表
- search单元没有提到一个特定的string
- Excel VBA:给定{X; Y}对Chart.MouseDown事件到{Category; Value}对的转换公式是什么?
- 先500克38美元,后续500克12美元
- 使用VC ++以编程方式从Excel复制单元格
- 将PasteSpecial复制到For Each循环不规则地退出
- 无法将excel中的mm / dd / yyyy转换为使用SSIS的csv yyyymmdddate格式