我可以使用Perl从PDF中提取表格吗?
我需要从PDF文档中提取表格对象,最好用Perl编程。 我可以剪切并粘贴到Excel中,但是一旦数据导入到Excel中,表格就需要进行相当多的手动编辑。
我已经做了一些search,但到目前为止,虽然大多数论坛认为大多数API是非常原始的。
我所知道的用于处理perl中的PDF的最好的模块是PDF :: API2 。 但是,如果不了解更多有关操作的信息,则需要努力提供进一步的build议。 另一种可能性是使用Excel内置的VBfunction进行编程,以便在将表格复制到Excel电子表格时,它将触发一个将执行格式设置的macros。
我认为最好的CPAN模块可能是CAM::PDF
。
然而,我没有使用模块,所以我不能确认它会(很容易)做你所需要的,但它是一个PDF manipulation library
, 模块作者在这里回答关于CAM::PDF
问题 。
另请参阅前面的问题: 如何从Perl中的PDF文件中提取文本?
/ I3az /