数独子的复数计算太多了

我有一个计算独特patients和/或MRN数量的问题。 为了确保每个患者只有一个唯一的MRN ,甚至那些在Excel数据库中可能出现的不止一次,我将参考的一个病人与他们各自的ID相交三次。 我的问题是使用公式:

 =SUM(IF(FREQUENCY(MATCH(E4:E317,E4:E317,0),MATCH(E4:E317,E4:E317,0))>0,1)) 

对于患者的姓名,结果在94 ,我相信是正确的,但是:

 =SUM(IF(FREQUENCY(MATCH(F4:F317,F4:F317,0),MATCH(F4:F317,F4:F317,0))>0,1)) 

对于患者的MRN结果为95 ,这不匹配。 这最初提示我,也许一个病人不小心有两个MRN 。 但是,当我多次交叉引用以确保一次input一个条目时,情况并非如此。

任何想法,为什么发生?

数据透视表可以是一种快速且相当简单的方法来确定组件应该是唯一对的二元组在哪里,在less数情况下(其他解决scheme在许多情况下可能效果更好):

SO19461466的例子

可以在一个“通行证”中检查的2元组的数量几乎是无限的,并且可以通过空白行来识别不匹配。 在示例中,MRN 4.00与两个名称ad相关联,并且可以看出a也与MRN 1.00相关联。

或者,删除重复和sorting将获得非常相同的结果,虽然certificate了一个或多个重复值,而不是空白。

尝试在名称旁边插入一列。 假设名称旁边的新列是F,在F4中放置以下内容:

  COUNTIF($E$4:$E$317,E4) 

然后将F4剪切并粘贴到F5:F317中

总和栏F

使用相同的方法进行MRM。