用python在excel文件中组织数据

我有一个类似于这样的excel文件:

**Part** **Quantity** **Category** **Board** part1 4 RES board1 part2 3 CAP board4 part3 2 CAP board3 3 CAP board2 4 CAP board4 part4 3 DIO board2 

无限的 理想情况下,我想要的是可以将5-6个板子列出来并为它们创build一个列,并为每个单独的部分分别放置数量,换句话说,

 **Part** **Category** **Board1** **Board2** **Board3** **Board4** part1 RES 4 0 0 0 part2 CAP 0 0 0 0 part3 CAP 0 3 2 4 part4 DIO 0 3 0 0 

我不要求其他条目填充零。 他们可以留下没有填充的细胞。 请记住,我从没有分组的上述excel文件开始,也就是说,零件号码是重复的,每一行都被填充。 但是,我不能重复部分,这就是为什么我使用pandasgroupby命令来组织它们,并有效地删除重复。 这是我目前非常简单的脚本:

 import pandas as pd import numpy as np import sys import subprocess #load csv file df = pd.read_excel('/home/Linux/.../raw-inventory.xlsx') #group by part number organize = df.groupby(['Part','Value','Description','Qty','Board']).sum() #open to .csv organize.to_excel('organizedlist.xlsx') #opening outputted file subprocess.call(organize, shell=True) print('Done') 

我一直在pandas和xlsxwriter环顾四周,我还没有看到一个好办法做到这一点。 也许有人在这里有一个想法?

最好使用原始的.xlsx文件,但必须有一种方法来删除重复的部分。 这就是为什么我使用groupby pandasfunction。 它保留所有其他数据,并消除“部分”栏下的多个实例。 任何build议,从简单到复杂,build议python包等,将不胜感激!