使用XML将<HTML>表导出到Excel

我正在使用此方法将HTML表格导出到Excel。 但是,我的数据中的一些colums有<字符。 当我尝试在Excel中打开文件时,这会导致错误。 有没有办法忽略这些字符或自动replace它们? 例如:

 <tr> <td>Assume A>B</td> </tr> 

PS:我已经有了<字符的html数据。 我把它拉到一个新的页面,其中有一个button导出到Excel(使用XML格式)。

我不知道你提到的问题有任何解决办法。 然而,一个解决方法是使用Perl / sed编写一个小的数据卫生脚本来清理数据。 这样的脚本的细节可能会从这里拿走。

一般MS-Excel对' < '字符没有问题。 不过,HTML应用程序倾向于将“ < ”字符解释为HTML标签的开始。

你可以用&lt; 在导出和导入过程中,并在Excel中将其replace回“<”。

或者您可以确保文本字段在过程中被引用。