从Excel中删除HTML字符上传到精确的在线项目
我有一个电子表格,上传到精确在线的项目。 许多项目仍然有包含大量HTML的文章描述,例如:
<p><span style=""font-size: 12px""><span style=""font-family: verdana, geneva, sans-serif"">text<br /> text max text<br /> text</span></span></p>
我试图用手来replace所有的事件,并使用Excel查找/replace,但它涉及数以千计的文章。
有没有可能使用Invantive SQL删除这些特殊字符,并获得纯文本?
处理这种情况的最佳方法是将Excel范围定义为命名范围或Excel表格。
我们假设Excel范围被命名为“MYDATA”。
然后在Invantive SQL中,您可以input:
select xmldecode /* Replace & by & etc. */ ( replace /* Remove line feeds for exact online when not desired. */ ( regexp_replace /* Remove all other XML/HTML tags. */ ( regexp_replace /* Replace line break in HTML by a line feed. */ ( COLUMN , '<br/>' , chr(10) ) , '<[^>]*>' , '' ) , chr(10) , ' ' ) ) from MYDATA@ic
当然,你可以这样做:
insert into exactonlinerest..items(columns) select ... -- see above