使用XML将<HTML>表导出到Excel
我正在使用此方法将HTML表格导出到Excel。 但是,我的数据中的一些colums有<
字符。 当我尝试在Excel中打开文件时,这会导致错误。 有没有办法忽略这些字符或自动replace它们? 例如:
<tr> <td>Assume A>B</td> </tr>
PS:我已经有了<
字符的html数据。 我把它拉到一个新的页面,其中有一个button导出到Excel(使用XML格式)。
我不知道你提到的问题有任何解决办法。 然而,一个解决方法是使用Perl / sed编写一个小的数据卫生脚本来清理数据。 这样的脚本的细节可能会从这里拿走。
一般MS-Excel对' <
'字符没有问题。 不过,HTML应用程序倾向于将“ <
”字符解释为HTML标签的开始。
你可以用<
在导出和导入过程中,并在Excel中将其replace回“<”。
或者您可以确保文本字段在过程中被引用。