如何使用给定的标准提取单元格中的内容

我正在通过Excel从大量的HTML代码中提取一些有用的信息。

当我将内容复制到Excel中时,所有信息都被安装到1个单元格中。 我需要让他们以可读格式进行布局。

我希望提取给定描述之间的信息,并以<结尾。

例如<'abcde'>12345<'xx>

如果我给出的标准是<'abcde'> ,我希望细胞返回12345

Excel能做这样的事情吗?

Excel不能parsingHTML。 你可以玩弄TEXTfunction,到达可能有用的东西。 这通常比它的价值更麻烦

举个例子,如果你把标签作为input的话,这是有效的

 =SUBSTITUTE(SUBSTITUTE(A1,"<'abcde'>",""),"<'xx>","") 

这也适用于更通用的意义,返回两个<>标签之间的任何内容

 =MID(A1,FIND(">",A1,2)+1,FIND("<",A1,2)-FIND(">",A1)-1) 

在C2(每张提供的图像)中,

 =REPLACE(REPLACE(A2, FIND("<", A2, 2), LEN(A2), TEXT(,)), 1, FIND(">", A2), TEXT(,)) 

在这里输入图像说明