pandas:如何读取定义多列的excel文件作为多索引?

我有一个数据框,每行包含一个办公室位置对象与几个属性,如Global RegionPrimary Function ,以及几个能耗数据作为数值遵循。 所有列的名称如下所示:

 ['Global Region', 'Primary Function', 'Subsidiaries', 'T&D Loss Rate Category', 'Type', 'Ref', 'Acquisition date', 'Disposal date', 'Corporate Admin Approver', 'Data Providers', 'Initiative administrator', 'Initiative approver', 'Initiative user', 'Invoice owner', 'Apr to Jun 2012', 'Jul to Sep 2012', 'Oct to Dec 2012', 'Jan to Mar 2013', 'Apr to Jun 2013', 'Jul to Sep 2013', 'Oct to Dec 2013', 'Jan to Mar 2014', 'Apr to Jun 2014', 'Jul to Sep 2014', 'Oct to Dec 2014', 'Jan to Mar 2015', 'Apr to Jun 2015', 'Jul to Sep 2015', 'Oct to Dec 2015', 'Jan to Mar 2016'] 

如何根据不同的属性对不同的位置进行sorting并查看数据,例如基于primary functionglobal region 。 我可以看到primary functio是研发的所有地区的平均能源消耗或排名能源强度。

我想到了多指标,但我不知道该怎么做。 我试过这个:

 test = xls.parse('Sheet1',index_col=['Lenovo Global Region','Primary Function', 'Subsidiaries', 'Type','Acquisition date','Disposal date','Country']) 

它没有工作,错误说我只能使用数字而不是string,所以我试过这个:

 test = xls.parse('Sheet1',index_col=0,1,3,4,5,7,9,10) 

仍然没有工作。 任何人有好的build议?

您可以使用带有参数index_col read_excel ,其中包含必要列的位置list

样品:

 df = pd.read_excel('test.xlsx', sheetname='Sheet1', index_col=[0,1,3]) print (df) Subsidiaries Type Ref Global Region Primary Function T&D Loss Rate Category 1 1 cas 10 2 2 cbd 20 3 3 dcd 30 

高强

读一个多指标 。

所以,如果添加[]它可以工作:

 test = xls.parse('Sheet1',index_col=[0,1,3,4,5,7,9,10])