所有重复项不会被删除,因为它使得行1成为一个免疫标题行

所有重复项不会被删除,因为它往往会忽略第一行,并将其视为标题行。

https://ibb.co/b4GvJG

我正在尝试删除所有列的重复项。 这是第一行中的一对重复就足够了。 在这种情况下,b变成b.1。 A栏也有一些数字,尽pipe这个数字迄今为止并没有影响到工作,而且比打破工作更令人讨厌。 当我们处理大量的Excel电子表格时,大量文件中缺less一个重复的文件真的会加起来。

我假设通过添加一个标题列或删除标题行,然后数据可以被复制,而不是忽略第一行。 为了解决这个问题,我尝试添加标题,删除级别并删除开始行:

df = pd.DataFrame({'Heading': data}) df.to_excel(writer, sheet_name='Sheet1', startrow=2) df.to_excel(writer, sheet_name='Sheet1', startrow=2, header=False) raw_data = {'0': ['first_name', 'Molly', 'Tina', 'Jake', 'Amy']} #df.columns = df.columns.droplevel(0) #df.to_excel(writer, header=None,index=False) #df = df.drop_duplicates(subset=[df.columns[6]]) 

到目前为止,我还没有取得任何成就,问题依然存在。

标准代码:

 import pandas as pd df = pd.read_excel("C:/Documents/Ha.xlsx", sheetname=0) writer = pd.ExcelWriter('C:/Documents/Ha.xlsx') import xlsxwriter import pandas as pd df.to_excel(writer, sheet_name='Sheet1', startrow=2, header=False) df = df.drop_duplicates(subset=[df.columns[2]]) writer1 = pd.ExcelWriter('C:/Documents/Book2.xlsx') df.to_excel(writer1,'Sheet1') writer.save() print(df)