embeddedExcel文件在XSL-FO驱动(Pdf) – 文档生成

我们正在使用XSL-FO转换生成我们所有的官方文档,使用.xml文件作为input并生成.pdfs。基本上,这些.xml文件中的所有内容都是纯文本或xhtml。 这对于日常使用情况来说是完美无缺的,但是我们的一些用户引用了我们的XSL-Fo变换器(Antenna House)本身不能处理的Microsoft Excel文件(和afaik,其他人也没有这样做)。

所以我们做的或者正在做的作为一个中间的,短期的解决scheme是我们从用户定义的printareas中创build图像,并将这些图像embedded到.pdf中。

但是,由于这些图像显然不是“可search”的内容,所以我们正在低估OCR这些.pdf等的后处理步骤,但是在我看来,这一切都深入到了解决方法的漏洞中。

我曾想过将这些.xls文件转换为SpreadsheetML,并使用我们的xsl-fo样式表进行覆盖,但是看看spreadsheetml规范,我也放弃了这个希望,至less在执行时不会抛出几十个人工月。

所以,要回到我的实际问题,您将如何处理xsl-fo驱动的文档生成中的Microsoft Excel文件?

干杯和感谢,-J

您可以将Excel文件转换为PDF,然后合并生成的文档。 它不是通过XSL-FO直接处理。

就个人而言,我甚至不会尝试将PDF文件存储在PDF中,我将从PDF链接到它。 Excel是封闭的,非常复杂,对于打开的部分(新的XML格式),它仍然可以(通常是)包含二进制blob及其移动目标。 我不认为这是值得打仗的战争。

你的.xls文件有公式吗? 如果不只是使用表格,行和单元格标签在x中将xlsx转换为xsl-fo。 从来没有看过xml文件与公式的xlsx文件。 让我怀疑,如果你可以保存一个Excel文档“可见”,没有公式只是结果? 有点像“印刷到卓越”?

Windward Docgen正是你想要的。 随着Windward你在Word,Excel或PowerPoint中devise文档,然后我们的引擎将该模板与数据合并,以创build最终文档。 该引擎可以在Java和.NET中使用,并且不会在服务器上使用Office,因此速度非常快,并且会为您提供最终的PDF,其中包含embedded的Excel和评估的所有macros。 (免责声明 – 我是Windward的首席技术官。)