将列A与列B进行比较,并将两列中的项目复制到列C中

我有两列,每列包含一个url列表(超过50,000),其中一些是重复的。 带有简化url的屏幕截图: http : //tinypic.com/r/nevmzn/8 。

请注意,第一行有两个略有不同的URL,但每个都包含相同的域: www.apple.comhttp://www.apple.com直接指向同一个站点,因此第三列应反映这一点。

有没有一种方法可以在第三列(两列)自动sorting哪些URL是重复的,哪些不是?
有没有我可以使用的公式,或Excelfunction,将帮助我自动做到这一点?

如果你只是想从比较中去掉http://部分,你可以使用

= IF(SUBSTITUTE(A1, “HTTP://”, “”)= SUBSTITUTE(B1, “HTTP://”, “”),替代(B1, “HTTP://”, “”),“无“)

您可以使用=IF(RIGHT(A1,LEN(A1)-FIND(".",A1))=RIGHT(B1,LEN(B1)-FIND(".",B1)),RIGHT(A1,LEN(A1)-FIND(".",A1)),"No")

=RIGHT(A1,LEN(A1)-FIND(".",A1))将从一个单元格返回website.com ,即使它以http://http://www.开头http://www.www.

上面的公式只是比较每一栏的url,如果是一个匹配的话,就会返回网站,否则返回“否”