Excel到XML的数据剥离

我试图从数千个相同的Excel 2007/2010文件中去除数据。 我宁愿使用刮擦技术来做到这一点。 是否可以刮一个Excel文件,因为据我所知,该文件基本上是某种XML格式。

那么,是否有可能将Excel文件转换为XML或其他标记格式?

XLSX格式实际上是一个ZIP文件,但具有不同的扩展名。 如果您使用自己喜欢的zip程序解压缩,则会发现工作表数据位于xl \ worksheets内。 每个工作表被保存为一个单独的XML文档。 您应该能够像Michaelbuild议的那样使用XSLT来提取您需要的数据。

默认情况下,Excel 2010文件采用XML格式。 那么你的Excel文件目前处于什么文件格式(即他们有什么扩展名)? 你的问题在这个问题上有些模棱两可。 如果它们已经在XML中,则可以使用XSLT来擦除它们。