在两列上进行内连接,它们的值不是100%相等

我有两个excel文件,一列有两列(ID1,名称),另一列有两列(ID2,名称),我需要导出一个文件三列(ID1,ID2,名称)。

问题是在每个文件中都有名字,而不是在另一个文件中,更大的问题是在两个文件中写同一个名字是有区别的,这两个文件是文件语言的常见区别,比如在阿拉伯语中的字符'أ'可以在没有Hamza'ا'(我的意思是我不能使用两个string之间的标准等同操作来指定一个文件中的名称与另一个文件中的另一个相同)下编写。

我的问题是有没有什么工具可以帮助,而不用为它编写代码,我听说过SQL集成服务,但我什么都不知道,请你指点我可以帮助解决任何参考我的问题。

任何链接,build议,或其他帮助将不胜感激。

提前谢谢了

你有一个有趣的问题,但不幸的是,在这种情况下,有趣=难。 使用英文input名称,我们可以使用一些名称匹配algorithm(双倍音符,最小编辑距离,Damerau-Levenshtein距离等等),但是我不知道如何用阿拉伯语这样的丰富语言工作。 我在SU上回答了一个类似的问题https://superuser.com/questions/480133/record-matching-software-to-compare-two-tables-and-match-on-based/481592

尝试SSIS的模糊能力: 模糊查找和模糊分组不会伤害。 在你的情况下,模糊分组是你想要尝试的。 这些是企业版的function,所以从许可的angular度来看,这是要注意的。 他们在开发版中可以正常工作,但是如果您部署并尝试在标准版SQL Server上运行,则会失败。