在Excel中search重复的单元格

我有一个存储在Excel文件中的order_items表的数据列。 该表大约有一百万行,包含列item_id,order_id,价格和数量。 除此之外,我还有一个Oracle数据库,它的主键是从item_id和order_id组合而成的。

当我尝试将数据导入到Oracle表中时,出现主键被违反的错误。 由于我随机生成表格数据,因此可能会有一些情况下有百万行,其中一个订单包含多个相同的产品。

我能够通过任意一列对数据进行sorting,但是我不想用手去查看所有这些行,所以有人可以告诉我什么是在Excel中查找多行的最简单的方法,它们有相同的item_id (标记为A)和order_id(标记为B)列。

使用COUNTIFS非常简单

我假设行1是标题行,E是下一个空白列

在E2中使用公式

=COUNTIFS(A:A,A2,B:B,B2) 

在列中填写此公式

在这里输入图像说明

Col E> 1中的任何东西都是该订单上出现多次的物品

在这里输入图像说明

请注意数量和价格的差异,您可能希望在删除重复行之前将行组合成1

如果删除重复项,公式将更新为1

请记住,您正在使用COUNT – 因此具有相同item_id和order_id的所有行都将具有> 1的计数,而不仅仅是find的第二个(或更多)行
(所以不要只是去删除所有这些行,因为你将删除原来的dups)

基于第一原则的思考表明,sorting是一个好主意,因为Excel的sortingalgorithm是快速的,应该在NlogN(基数2)的时间内执行,所以你将在一百万行中讨论20,000,000次操作,这需要几秒钟的时间来运行。

所以首先共同对Item_ID和Order_ID进行sorting。

那么你可以使用线性比较方法来检测重复行使用像这样的公式

 =AND(A2=A1,B2=B1) 

在这里输入图像说明