Excel根据URL-paramter自动删除重复之前的CSV

我正在使用真正简单的stream量logging器存储date,时间戳,IP和用户访问我的网站上的网站。 访问该网站的每个用户都通过以下forms的URL中的参数来分配UID:

http://www.domain.com/site.php?=dTM_c1_uid7 dTM = customer, c1 = category 1, uid7 = uid for person 7 

存储的csv文件包含以下内容:

 "DATE","TIME","IP","LOOKING_FOR" "2016-05-22","07:30:40","XX.XX.XX.XX","/site.php?=dTM_c1_uid7" "2016-05-22","07:31:10","XX.XX.XX.XX","/site.php?=dTM_c1_uid7" "2016-05-22","07:31:19","XX.XX.XX.XX","/site.php?=dTM_c1_uid8" 

信息被存储在一个CSV文件中,在那里我试图总结数据的结果,这些数据是由另一个脚本实时显示的。 然而,由于许多访问者是同一个人访问网站的次数不止一次,所以我想根据URL中的UID参数去除这些参数,然后计算总和,所以每个计数(hit)可以计算为唯一匹配。

因此,在计算总和之前,我正试图制定一个公式来自动删除包含“_uid7”参数的重复项。

是否有一个聪明的方法来构build一个公式,可以自动做到这一点?

谢谢。

假设您的数据从A1开始请在B1发布以下公式,并在column A填写column B中的数据

  =TRIM(SUBSTITUTE(MID(A1,(SEARCH("dTM_c1_",A1,1)+7),99),CHAR(34),REPT(CHAR(32),99))) 

你会得到uid7,uid8等可以计数或其他处理可以完成。 csv数据的屏幕截图 截图为csv data2

编辑基于您的意见,并采取"dTM_c1_uidnn.."string计数出现在下面的快照。 我已经显示了两个快照,其中一个隐藏帮手列。

snapshot1 snapshot2

这是我目前能做的最好的。 可以使用Excel本机删除重复或通过VBA例程筛选列B. 使用频率函数find数值的唯一值是比较容易的。但不pipe怎样,在重复尝试之后,尽pipe遵循了一些教程,但是我无法得到文本string的期望结果。 我会感谢您的反馈积极或消极。 我的努力将继续find最理想的解决scheme。