在保存为制表符分隔的txt文件之前,在Excel工作表中取消优化表格

我经常在Excel工作簿的许多工作表中将数据作为“漂亮的表格”。 “漂亮”的意思是说每个工作表的顶部和底部都有解释性文本,标题有合并的单元格,标题和第一个数据行之间有空行,数据列之间有空白列等等。

这是一个犯罪分子的屏幕抓取。

这里有减less体力劳动的最佳做法吗?

一种方法可能是在Excel中修复所有这些表格。 另一个可以是“按原样”保存制表符分隔的txt,手动select和导入数据行,删除空白列,并手动input标题信息。 我倾向于做后来,但即使这是相当手动。

专业人士在做什么? 当我这样做的时候,我觉得那个不懂剪贴的人。

FWIW,我使用Python,Stata和R来处理大多数事情,但是我对任何简化这个过程的工具都是开放的。 谢谢!

说实话,我在清理数据的过程中所使用的自动化数量取决于我必须做的次数。 对我来说,我想通过macros修改Excel中的文件。

如果您的文件总是具有相同的格式(对于特定的任务),则可以简单地logging您正在执行的步骤的macros,并将其保存在个人工作簿中

如果他们略有不同,但有一个主题的变化,你可以修改loggingmarco(理想的分解到像DeleteTopRowsDeleteEmptyColumns这将接受不同的参数取决于input文件)

我认为Excel VBA是这种types的工作最简单的工作,因为Excel应用程序可以帮助很多内置函数。 例如在你的表格上面的Range("10:11").Delete将删除它们。