Python来结合Excel电子表格

大家好…使用pandas结合Excel电子表格的问题。

问题是，列的顺序在组合时会丢失。如果有更多的文件需要组合，格式会更糟糕。

如果给出错误信息，如果文件数量很大。

ValueError: column index (256) not an int in range(256)

我正在使用的是：

 import pandas as pd df = pd.DataFrame() for f in ['c:\\1635.xls', 'c:\\1644.xls']: data = pd.read_excel(f, 'Sheet1') data.index = [os.path.basename(f)] * len(data) df = df.append(data) df.to_excel('c:\\CB.xls')

原始文件和结合如下所示：在这里输入图像说明

结合大量这样的类似Excel文件的最佳方式是什么？

谢谢。

我通常使用xlrd和xlwt ：

 #!/usr/bin/env python # encoding: utf-8 import xlwt import xlrd import os current_file = xlwt.Workbook() write_table = current_file.add_sheet('sheet1', cell_overwrite_ok=True) key_list = [u'City', u'Country', u'Received Date', u'Shipping Date', u'Weight', u'1635'] for title_index, text in enumerate(key_list): write_table.write(0, title_index, text) file_list = ['1635.xlsx', '1644.xlsx'] i = 1 for name in file_list: data = xlrd.open_workbook(name) table = data.sheets()[0] nrows = table.nrows for row in range(nrows): if row == 0: continue for index, context in enumerate(table.row_values(row)): write_table.write(i, index, context) i += 1 current_file.save(os.getcwd() + '/result.xls')

而不是data.index = [os.path.basename(f)] * len(data)你应该使用df.reset_index() 。

例如：

1.xlsx：

 ab 1 1 2 2 3 3

2.xlsx：

 ab 4 4 5 5 6 6

码：

  df = pd.DataFrame() for f in [r"C:\Users\Adi\Desktop\1.xlsx", r"C:\Users\Adi\Desktop\2.xlsx"]: data = pd.read_excel(f, 'Sheet1') df = df.append(data) df.reset_index(inplace=True, drop=True) df.to_excel('c:\\CB.xls')

cb.xls：

  ab 0 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6

如果您不希望数据框的索引位于输出文件中，则可以使用df.to_excel('c:\\CB.xls', index=False) 。

Python来结合Excel电子表格

复制工作表时VBA错误'9'下标超出范围

search范围寻找多个条款，然后继续

将数组复制到已过滤的范围会产生不合理的结果

SQL并排查询。匹配路线

隐藏我所有的Excel范围名称是否有任何问题

无法使用SUMPRODUCT引用其他电子表格

没有足够的内存来完成这个动作

Wicket Excel页面过期

第二个IF语句中的错误在哪里？

查找是否所有list1元素都大于excel中的第二个列表

Python来结合Excel电子表格

复制工作表时VBA错误'9'下标超出范围

search范围寻找多个条款，然后继续

将数组复制到已过滤的范围会产生不合理的结果

SQL并排查询。 匹配路线

隐藏我所有的Excel范围名称是否有任何问题

无法使用SUMPRODUCT引用其他电子表格

没有足够的内存来完成这个动作

Wicket Excel页面过期

第二个IF语句中的错误在哪里？

查找是否所有list1元素都大于excel中的第二个列表

SQL并排查询。匹配路线