如何使用给定的标准提取单元格中的内容
我正在通过Excel从大量的HTML代码中提取一些有用的信息。
当我将内容复制到Excel中时,所有信息都被安装到1个单元格中。 我需要让他们以可读格式进行布局。
我希望提取给定描述之间的信息,并以<
结尾。
例如<'abcde'>12345<'xx>
如果我给出的标准是<'abcde'>
,我希望细胞返回12345
。
Excel能做这样的事情吗?
Excel不能parsingHTML。 你可以玩弄TEXT
function,到达可能有用的东西。 这通常比它的价值更麻烦
举个例子,如果你把标签作为input的话,这是有效的
=SUBSTITUTE(SUBSTITUTE(A1,"<'abcde'>",""),"<'xx>","")
这也适用于更通用的意义,返回两个<>
标签之间的任何内容
=MID(A1,FIND(">",A1,2)+1,FIND("<",A1,2)-FIND(">",A1)-1)
在C2(每张提供的图像)中,
=REPLACE(REPLACE(A2, FIND("<", A2, 2), LEN(A2), TEXT(,)), 1, FIND(">", A2), TEXT(,))