结合Excel电子表格
我有一个Excel工作簿与许多选项卡。 每个选项卡都具有与其他所有标题相同的标题。 我想将每个选项卡中的所有数据合并到一个数据框中(不必为每个选项卡重复标题)。
到目前为止,我已经尝试过:
import pandas as pd xl = pd.ExcelFile('file.xlsx') df = xl.parse()
可以使用parsing参数,这将意味着“所有电子表格”的东西? 或者这是错误的方法?
提前致谢!
更新:我试过了:
a=xl.sheet_names b = pd.DataFrame() for i in a: b.append(xl.parse(i)) b
但这不是“工作”。
这是一种方法 – 将所有工作表加载到数据框字典中,然后将字典中的所有值连接到一个数据框中。
import pandas as pd
将sheetname设置为None,以便将所有工作表加载到数据框的字典中,并忽略索引以避免以后出现重叠值(请参阅@bunji的注释)
df = pd.read_excel('tmp.xlsx', sheetname=None, ignore_index=True)
然后连接所有的dataframe
cdf = pd.concat(df.values()) print(cdf)