使用POI EventModel读取Excel文件

我想使用Apache POI的HSSF EventModel读取Excel文件(.xls格式)。 我的Excel表是一个简单的Excel文件,没有macros。 只是想知道什么types的logging我必须照顾。

以下是Excel文件中的数据types:

1. String 2. Boolean 3. Number 4. Date. 

我发现了这些BoolErr,空白,数字。 让我知道我必须照顾的其他logging。

谢谢Srinivasan

如果您希望数字和date在Excel中显示,那么您需要所有的单元格格式信息。 这是因为数字单元格和date单元格的存储方式都是一样的,因为每个logging的浮点数都是一个单元格(除了MulRks周围的一些特殊情况外),只是格式化规则会告诉您它是date还是数字,如何显示它们。

我build议你做的是看两个很好的例子,使用HSSF事件模型基于事件的.xls文件提取。 首先是POI本身, EventBasedExcelExtractor提供纯文本输出。 第二个是Apache Tika, ExcelExtractor ,它提供了一个XHTML版本

在这两种情况下,您都会看到只logging和处理一些loggingSID的代码,而且您还会看到它们的用途。 在使用事件模型时,您还将看到如何访问POI的格式化代码,您需要使用该模式才能使您的数字和date看起来正确。

您可能还想看看另一个POI示例XLS2CSVmra ,该示例演示了如何处理通常没有使用的行和单元格不显示在Excel文件中的事实。 对于文本提取,这不是一个问题,但像CSV导出知道单元格或行丢失,有多less是关键!