用python从多个xml文件中提取数据
我刚刚开始为我的新工作学习python,即使这个任务听起来非常直截了当,对我来说一切都是非常困难的。
我想从多个XML文件中提取几个节点,最好把信息放到一个excel文件中。 每一行都应该包含来自一个xml文件的信息,列应该代表我正在寻找的特定节点,比如“Zip-code”“town”。 并不是所有的xml文件都包含所有的节点,所以这将是完美的,如果节点“Zip-code”不存在,它只是留下空白的单元格。
有人可能会指出一些提示如何开始,或者,这也是可能的,一个特殊的程序,这是很容易学习和使用? 我的公司和我只需要做一次约2000个文件。
非常感谢你=)
要打开文件并获取其内容,可以使用Python函数: 文档 。
对于XMLparsing,我总是使用美丽的汤 。 这是一个具有良好文档的HTML / XMLparsing器,大部分“正常工作”。
为了创buildExcel文件,你可以使用Xlsxwriter 。