Tag: 相似度

“模糊查找”添加结果

使用Excel 2010和Microsoft的“模糊查找”添加进来比较2个工作表中的列。 第一张工作表大约有48,000行(x 3列),第二张工作表大约有23,000行(x 5列)。 “模糊查找”是比较每一列,并返回两者之间的相似性。 模糊查找似乎运行没有问题,并在大多数情况下,结果似乎是正确的。 例如: W2-NK22/16在一个工作表中显示与W2NK2216具有0.97的相似性。 但不是在所有情况下。 有些我预计会有一定程度的相似性,而不是由加载项返回0.000。 例如: 761689700000 应该有一定程度的相似性: 761689700000EN4239 但模糊查找join返回0.000 。 这两个字段被格式化为文本。 之前或之后都没有空格,前12个字符是相同的。 我已经卸载并重新安装了加载项,并使用了默认设置。 我改变了唯一的其他模糊查找设置是在configuration – >全球 – UseApproximateIndexing。 我已经把它设置为既没有影响也没有影响的错误和真实。 我有几百个像上面那样显示0.000相似度的例子,但是经过检查似乎是非常相似的。 之前和之后的行显示不同程度的相似性。 任何想法或想法为什么这似乎没有正常工作,或更好的方式来做这个近似的匹配,将不胜感激。