Tag: cp1252

Excel电子表格中的字符编码(以及用什么Java字符集来解码)

我正在使用JExcel库来读取Excel电子表格。 电子表格中的每个单元格都可以包含任何类似于44种语言(英语,葡萄牙语,法语,中文等)的本地化string。 今天我不告诉API关于它应该使用的编码的任何东西。 它处理中国行,但总是把葡萄牙和德国搞砸了。 不知怎的,默认编码(我的开发箱上的MacRoman,生产上的UTF-8)没有正确解释它从Excel工作簿中抽出的string。 JExcel如何解释文件的字符编码一定有问题。 话虽如此… excel工作簿中的所有string是否使用相同的字符集进行编码? 有工作簿元数据我可以问这个字符集是什么(我还没有find它)? 如果我通过像jchardet(http://jchardet.sourceforge.net/)这样的东西来运行所有的单元格,是否可以为整个工作簿预​​测字符编码(这在第一个问题上就是“是的,在一个给定的工作簿中的所有蜇伤编码相同的字符集“)? 这么多的问题,那么短的时间。