在Python中如何重新组织Excel中不一致的列?

我有一堆报告,都包含相同的信息,但列和顺序不一致,因此当我运行函数来parsing信息时,我没有得到我想要的。

我怎样才能使用python以一致的方式组织列以便后续工作?

目前列看起来像;

['Comment', 'Rec Date', 'Receipt Number', 'Rec Amt', 'Receipt Method', 'Status'] ['Comment', 'State', 'Rec No', 'Rec Date', 'Rec Amt', 'Status'] ['Receipt Number', 'Rec Date', 'Rec Amt', 'Comment', 'State', 'Status'] ['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'State', 'Rec Method'] ['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'Receipt Method', 'State'] ['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'State', 'Rec Method'] 

我希望所有这些类别都包含在列中。 (没有特定列值的点会得到一些占位符或空值。)

首先为DataFrame

 df = pd.read_excel('file.xlsx') 

我相信你需要通过dict rename列,然后通过sort_index对它们进行sort_index

 d = {'Rec No':'Receipt Number', 'Rec Method':'Receipt Method',...} df = df.rename(columns=d).sort_index(axis=1)