Excel近似文本匹配
我试图检查列A中有多less个string与列B中的string大致匹配
例:
如果在列B中有string“angry_birds_iph_app”,并且在列A中某处出现“angry_birds_iph_app”和“angry_birds_adrd_app”,我希望函数返回2。
看看Excel模糊查找加载项。 它可以从微软免费下载。 该工具实现了Levenshtein编辑距离algorithm,以返回行之间的相似性分数。 在其他可自定义的function中,该工具还允许您设置阈值,以确定值的匹配程度,以返回近似的结果。
而不是象你所说的那样返回计数,这个工具将返回一个表格,列A中与列B中每个条目最相似的匹配。从那里你可以简单地使用一个filter并对结果列进行计数。
http://www.microsoft.com/en-us/download/details.aspx?id=15011
除了Excel Fuzzy lookup
外接程序外,还有另一个加载项(也是免费下载) ,提供了一些可能有用的function。 一个是pwrVLOOKUP
并提供模糊的查找function。 另一个是pwrSIMILARITY
,并会给你一个相似性分数(在0和1之间),从中你可以在你的工作表中的匹配。 Excel的PowerUps
加载项可在Excel 2003中直到2013年。
一个例子是在这里发布的页面: 示例演示