在读入xlsx文件后,不能取回列名
你好,我有xlsx文件,并通过使用pandas合并成一个数据框。 它的工作,而不是取回我在xlsx文件中的列名,我把数字作为列,而列标题成为一行:像这样:
Output: 1 2 3 COLTITLE1 COLTITLE2 COLTITLE3
当他们应该是这样的:
Output: COLTITLE1 COLTITLE2 COLTITLE3
列标题不是列标题,而是成为一排。 我怎样才能找回我在xlsx文件中的正确的列名。 为了清楚起见,所有列名在xlsx文件中都是相同的。 帮助将不胜感激inheritance人我的代码如下:
# import modules from IPython.display import display import pandas as pd import numpy as np pd.set_option("display.max_rows", 999) pd.set_option('max_colwidth',100) %matplotlib inline # filenames file_names = ["data/OrderReport.xlsx", "data/OrderReport2.xlsx"] # read them in excels = [pd.ExcelFile(name) for name in file_names] # turn them into dataframes frames = [x.parse(x.sheet_names[0], header=None,index_col=None) for x in excels] # concatenate them atlantic_data = pd.concat(frames) # write it out combined.to_excel("c.xlsx", header=False, index=False)
我希望我正确理解你的问题。 你只需要摆脱index_col=None
,它将像往常一样返回列名称:
frames = [x.parse(x.sheet_names[0], header=None) for x in excels]
如果您添加index_col=None
pandas将把您的列名视为1行数据而不是数据框的列。