“模糊查找”添加结果

使用Excel 2010和Microsoft的“模糊查找”添加进来比较2个工作表中的列。 第一张工作表大约有48,000行(x 3列),第二张工作表大约有23,000行(x 5列)。 “模糊查找”是比较每一列,并返回两者之间的相似性。

模糊查找似乎运行没有问题,并在大多数情况下,结果似乎是正确的。 例如:

W2-NK22/16在一个工作表中显示与W2NK2216具有0.97的相似性。

但不是在所有情况下。 有些我预计会有一定程度的相似性,而不是由加载项返回0.000。 例如:

 761689700000 

应该有一定程度的相似性:

 761689700000EN4239 

但模糊查找join返回0.000 。 这两个字段被格式化为文本。 之前或之后都没有空格,前12个字符是相同的。

我已经卸载并重新安装了加载项,并使用了默认设置。 我改变了唯一的其他模糊查找设置是在configuration – >全球 – UseApproximateIndexing。 我已经把它设置为既没有影响也没有影响的错误和真实。

我有几百个像上面那样显示0.000相似度的例子,但是经过检查似乎是非常相似的。 之前和之后的行显示不同程度的相似性。

任何想法或想法为什么这似乎没有正常工作,或更好的方式来做这个近似的匹配,将不胜感激。

尝试添加内容,即使这种情况是2岁。 希望别人可以使用它。

对于转换,令牌化等 – 查看安装了模糊查找的相同文件夹。 有一个示例文件叫做Portfolio.xlsx和一个相应的Readme.docx文件。 这些是非常有帮助的。 坦率地说,关于Fuzzy Lookup加载项的文档是可怕的(但它是免费的)。 自述文件谈到一个称为“EditTransformationProvider”的权利,可能有助于解决这类问题。

我在工作中的几个过程中实现了Fuzzy,在Excel中工作时我们节省了数百个工时。 这不是开玩笑。