Excel文件太大,我应该把它转换成什么格式来提高脚本处理的时间

我有一个有大约15万条logging的excel表,查找replace,删除列等操作花费了大量的时间。 我需要编写一个脚本来执行一些任务,如查找和replace,sorting,删除行/列等。因为Excel表太大,像这样的任务花费很多时间。 我应该使用什么样的格式转换我的Excel表格,以便这些任务的处理时间变得更短,以便我可以创build一个脚本来执行任务>

你可以随时加载到SQLite数据库。 如果你正在做很多的发现,取代,那会很快。 在不了解数据的情况下,给出一个更有用的答案是很困难的,而且您需要在Excel中多长时间使用一次。

你可以编写一些Python来使用pyExcelerator和sqlite3模块将数据从Excel中提取出来并存储到SQLite中(然后再返回)。

当你说脚本时,我们在说什么语言和平台?

不知道详细信息,我build议将电子表格导入到SQL Server(或甚至Access)数据库,并将转换后的查询结果导回电子表格。 虽然我的数据集通常甚至超过了15万行,并且文本字段相对较less,但我对这种方法有很好的经验。

我相信你可以输出Excel文件作为XML。 如果您已经可以访问可以操纵XML结构的库,那么可能会很容易。 最糟糕的情况是将其转换为CSV文件,并执行一些原始文本操作(可能会更慢)。 当然,除非你在Excel里面指的是脚本/macros观,否则你很可能倒霉。 我不知道数据库转换,这可能是最好的,许多logging,也许别人可以帮助你在那里。

将它导出到数据库并保存在那里,十五万行对于Excel来说太过分了,大胆地处理2007!

纯文本,awk和sed是你的朋友