合并文件擅长覆盖Python中的第一列使用pandas

我有很多文件excel，我想使用下面的代码附加多个excel文件：

import pandas as pd import glob import os import openpyxl df = [] for f in glob.glob("*.xlsx"): data = pd.read_excel(f, 'Sheet1') data.index = [os.path.basename(f)] * len(data) df.append(data) df = pd.concat(df) writer = pd.ExcelWriter('output.xlsx') df.to_excel(writer,'Sheet1') writer.save()

Excel文件有这样的结构：

在这里输入图像描述

输出如下：

在这里输入图像描述

为什么python在连接excel文件时改变第一列？

我认为你需要：

 df = [] for f in glob.glob("*.xlsx"): data = pd.read_excel(f, 'Sheet1') name = os.path.basename(f) #create Multiindex for not overwrite original index data.index = pd.MultiIndex.from_product([[name], data.index], names=('files','orig')) df.append(data) #reset index for columns from MultiIndex df = pd.concat(df).reset_index()

另一个解决scheme是在concat使用参数keys ：

 files = glob.glob("*.xlsx") names = [os.path.basename(f) for f in files] dfs = [pd.read_excel(f, 'Sheet1') for f in files] df = pd.concat(dfs, keys=names).rename_axis(('files','orig')).reset_index()

什么是一样的：

 df = [] names = [] for f in glob.glob(".xlsx"): df.append(pd.read_excel(f, 'Sheet1')) names.append(os.path.basename(f)) df = pd.concat(df, keys=names).rename_axis(('files','orig')).reset_index()

最后写入excel没有索引和列名称：

 writer = pd.ExcelWriter('output.xlsx') df.to_excel(writer,'Sheet1', index=False, header=False) writer.save()

合并文件擅长覆盖Python中的第一列使用pandas

如何将控制台输出写入Java中的Excel文件

object__Worksheet的VBA数据透视表方法“PivotTableWizard”失败

Excel vba循环数月和数年

将行索引（variables）与VBA中的列组合在一起

使用Excel VBA创build文件夹并从weblink上传图像？

致命错误：当内存使用率非常高时，调用一个非对象的成员函数write（）

如果单元格突出显示，Excel用户定义函数

使用OpenText和SaveAs方法在VBS中打开相对path

显示货币的VBA文本框

从Excel到pandas的Csv中压平表