从Excel中删除HTML字符上传到精确的在线项目

我有一个电子表格,上传到精确在线的项目。 许多项目仍然有包含大量HTML的文章描述,例如:

<p><span style=""font-size: 12px""><span style=""font-family: verdana, geneva, sans-serif"">text<br /> text&nbsp;max&nbsp;text<br /> text</span></span></p> 

我试图用手来replace所有的事件,并使用Excel查找/replace,但它涉及数以千计的文章。

有没有可能使用Invantive SQL删除这些特殊字符,并获得纯文本?

处理这种情况的最佳方法是将Excel范围定义为命名范围或Excel表格。

我们假设Excel范围被命名为“MYDATA”。

然后在Invantive SQL中,您可以input:

 select xmldecode /* Replace &amp; by & etc. */ ( replace /* Remove line feeds for exact online when not desired. */ ( regexp_replace /* Remove all other XML/HTML tags. */ ( regexp_replace /* Replace line break in HTML by a line feed. */ ( COLUMN , '<br/>' , chr(10) ) , '<[^>]*>' , '' ) , chr(10) , ' ' ) ) from MYDATA@ic 

当然,你可以这样做:

 insert into exactonlinerest..items(columns) select ... -- see above