从pdf中的表格填充excel中的特定字段

什么是最快的方式做以下几点:

我有一个大量的表格pdf。 我想过滤具有特定标题的表格。 这些过滤的表格具有相同的标题和列格式。 现在我想通过为不同的表添加额外的列在Excel中生成一个组合的表。 这个表只应该从excel中的表中填充特定的字段,而忽略其余的部分。

在这里输入图像说明在这里输入图像说明

从pdf上面的2个表格中,只有下列字段应该在Excel中填充 在这里输入图像说明

现在我只想看到从不同的pdf表中导入的列中有不同的值的行(例如,如果(从pdf中的任何表中的字段号x =任何表中的字段x)

(绿色的是不同的(第一栏“标签”下的第一栏与第二栏“标签”下的第一栏不同)。 在这里输入图像说明

使用Apache POI来读取excel并在java中使用util方法来创buildpdf或根据需要执行任何逻辑。

https://poi.apache.org/spreadsheet/examples.html