Tag: levenshtein距离

Levenshtein距离/string匹配algorithm的短语: 我有两个电子表格，每个电子表格都提供有关在工作networking上运行的一大堆应用程序的信息。他们是由两个独立的人创造的，他们从来没有见过这样的人。因此，它们给予应用程序的名称在表单之间是不固定的。但是，它们是相似的。例如，可能会调用一个应用程序“Office 2010”，另一个“MS Office 10”或其他东西。我已经查阅了Levenshteinalgorithm，但是这似乎只适用于单词顺序不变的单个单词或短语，而只有拼写不同。（我不是计算机科学家，请随时纠正我）。因此，我正在寻找一种algorithm，对于一个表中的每个名称，可以遍历另一个表中的每个名称并find最接近的匹配。不一定是完美的，任何事情都会有所帮助。有任何想法吗？感谢所有能够帮助的人。

Interesting Posts

在两个不同的列中识别具有相同值的行

LibXL加载文件失败

Excel – 如果存在单词，则将数字转为0？

Excel自动input行

Excel复制和粘贴，同时保持数据validation

在Excel中使用Rank函数

JDBC – 在哪里可以find用于读取Linux（甚至Windows）中的excel文件（.xml）的types4 JDBC驱动程序

如何在Excel索引函数中debugging#REF

使用NPOI（1.2.5.0）删除Excel表格的列

想要使用for循环来find相同的值并在它们之间创build一个单元格

Excel和Microsoft.Office.Interop

用Excel中的过滤replace空列与另一列的内容

如何确定Excel范围是否隐藏？

vba – 在运行macros之前处理工作表更改事件

如何接受来自HTML的数据并将其发送到Excel？