需要从列表中删除重复项。 Set（）函数不起作用。 for循环方法也不是

我正在使用xlrd从Excel表格中提取数据。我想要的数据是在两列（“ID”和“位置”列）。每列包含成千上万的条目，其中大部分是完全重复的。我只是试图创build2个列表，其中包含来自两个Excel列的所有唯一条目。这是我的大部分代码，并显示了打印其中一个列表时显示的内容的示例：

rawIDs = data.col_slice(colx=0, start_rowx=0, end_rowx=None) #getting all of column 1 in a list IDs = [] for ID in rawIDs: if ID not in IDs: IDs.append(ID) #trying to create new list without duplicates, but it fails rawlocations = data.col_slice(colx=1, start_rowx=0, end_rowx=None) #getting all of column 2 in a list locations = [] for location in rawlocations: if location not in locations: locations.append(location) #same as before, also fails print set(IDs) #even set() doesn't remove duplicates, it just prints "rawIDs"

不pipe我怎么做，它总是打印原始列表，剩下所有的重复。

不言而喻，我已经看了很多其他类似的stackoverflowpost，他们的解决scheme不适合我。

编辑：我错了一个特定的。我意识到印刷

 print set(IDs)

实际上返回

“set（[item，item，item …]）”作为输出。所以它基本上把“set（）”放在“rawIDs”输出的周围。这对我来说没有任何意义，虽然…

另外这里是一个示例屏幕截图：

这里是一个示例截图

解决scheme：

看起来元数据（比如表格中的坐标位置）被存储起来，因此，即使文本可能相同，由于这个元数据，列表中的每个项目都是不同的。

修改for循环，使它们添加项目的string ，而不是项目本身，解决了我的问题，并取得了新的列表没有重复。

 rawIDs = data.col_slice(colx=0, start_rowx=5000, end_rowx=5050) IDs = [] for ID in rawIDs: if str(ID) not in IDs: IDs.append(str(ID)) rawlocations = data.col_slice(colx=1, start_rowx=0, end_rowx=None) locations = [] for location in rawlocations: if str(location) not in locations: locations.append(str(location)) print IDs #it prints a list with no duplicates!

需要从列表中删除重复项。 Set（）函数不起作用。 for循环方法也不是

根据另一列中子集中的值返回列中的值

如何使用Python从Excel中检索已保存的集合

如何在循环中定义“设置”variables？

导出VBA编辑器（VBE）设置

在VBAsorting中设置范围

设置一个范围，并在公式中使用该范围

一个数组（0）给了我一个超出指定范围的值

“默认情况下，”autofit列宽度更新“的勾号可以设置为未勾选

“信任访问VBA项目模型”checkbox是什么意思？

我怎样才能打印一个列表集合到一个文件，用python，在一个很容易放入excel的格式，消除所有不需要的字符？