在Python中如何重新组织Excel中不一致的列?
我有一堆报告,都包含相同的信息,但列和顺序不一致,因此当我运行函数来parsing信息时,我没有得到我想要的。
我怎样才能使用python以一致的方式组织列以便后续工作?
目前列看起来像;
['Comment', 'Rec Date', 'Receipt Number', 'Rec Amt', 'Receipt Method', 'Status'] ['Comment', 'State', 'Rec No', 'Rec Date', 'Rec Amt', 'Status'] ['Receipt Number', 'Rec Date', 'Rec Amt', 'Comment', 'State', 'Status'] ['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'State', 'Rec Method'] ['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'Receipt Method', 'State'] ['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'State', 'Rec Method']
我希望所有这些类别都包含在列中。 (没有特定列值的点会得到一些占位符或空值。)
首先为DataFrame
:
df = pd.read_excel('file.xlsx')
我相信你需要通过dict rename
列,然后通过sort_index
对它们进行sort_index
:
d = {'Rec No':'Receipt Number', 'Rec Method':'Receipt Method',...} df = df.rename(columns=d).sort_index(axis=1)