Tag: dataframe xlsxwriter

将Xlsxwriter工作表转换为Pandas Dataframe

我有一个从Excel表格中读取的DataFrame,其中我已经使用Xlsxwriter创build了一些新的列。 现在我需要使用我在Xlsxwriter中创build的新列(这是一个date列btw)过滤这个新的数据集。 有没有办法再次把这个新的工作表变成一个数据框,所以我可以过滤新的列? 我会尽力提供任何有用的代码: export = "files/extract.xlsx" future_days = 12 writer = pd.ExcelWriter('files/new_report-%s.xlsx' % (date.today()), engine ='xlsxwriter') workbook = writer.book df = pd.read_excel(export) df.to_excel(writer, 'Full Log', index=False) log_sheet = writer.sheets['Full Log'] new_headers = ('todays date', 'Milestone Date') log_sheet.write_row('CW1', new_headers) # This for loop just writes in the formula for my new columns on every line […]

pandas数据框来优化版本更改(索引名称在单独的行从列)

最近,我一直在使用python2.3.0,它有pandas版本0.16.2和xlsxwriter版本0.7.3。 我刚刚重新安装了一个更新的Anaconda版本,它是Anaconda2-4.0.0,它有pandas版本的0.18.0和xlsxwriter 0.8.4的pandas版本。 突然之间,许多用我以前写的本地excel图表生成excel文件的程序突然停止工作。 这是为什么: 对于一个简单的数据框,有3列名为A,B,C: 使用以前版本的pandas和xlsxwriter,df.to_excel()会生成一个像这样的excel文件, 随着新的pandas和xlsxwriter版本,这是我得到的。 差别很微妙。 但是,由于一行的差异,依靠excel文件的程序的后续步骤停止工作。 我知道我可以操纵数据框,使得excel文件中的输出看起来像前面的情况,即插入一个NaN行并将索引名称设置为“Path”。 但是,我不想这样做,因为我目前的程序相当复杂,并且有超过100个数据框被放入Excel表格的Excel文件中。 另一个原因是我也希望代码向后兼容,如果可能的话,如果我用Anaconda 2.3.0版运行代码,程序仍然可以工作。 有没有一个单行的解决scheme,使用df.to_excel(“file_name.xlsx”),使得它将生成一个excel文件与数据框的索引名称单独的行与列。

把许多pythonpandas数据框放到一个excel工作表中

只要是不同的工作表,将许多pandas数据框添加到Excel工作簿中是相当容易的。 但是,如果要使用“pandas”内置的df.to_excelfunction,将多个数据框合并到一个工作表中会有些棘手。 # Creating Excel Writer Object from Pandas writer = pd.ExcelWriter('test.xlsx',engine='xlsxwriter') workbook=writer.book worksheet=workbook.add_worksheet('Validation') df.to_excel(writer,sheet_name='Validation',startrow=0 , startcol=0) another_df.to_excel(writer,sheet_name='Validation',startrow=20, startcol=0) 上面的代码将不起作用。 你会得到错误的 Sheetname 'Validation', with case ignored, is already in use. 现在,我已经做了足够的尝试,find了一种使其工作的方法。 writer = pd.ExcelWriter('test.xlsx',engine='xlsxwriter') # Creating Excel Writer Object from Pandas workbook=writer.book df.to_excel(writer,sheet_name='Validation',startrow=0 , startcol=0) another_df.to_excel(writer,sheet_name='Validation',startrow=20, startcol=0) 这将工作。 所以,我在stackoverflow上发布这个问题的目的是双重的。 首先,我希望这将帮助某人,如果他/她在Excel中试图将许多数据框放在一个工作表中。 其次,有人能帮我理解这两个代码块之间的区别吗? 在我看来,他们几乎是相同的,除了第一块代码创build工作表提前“validation”,而第二块没有。 我得到那部分。 我不明白的是为什么它有什么不同呢? 即使我不提前创build工作表,这行,最后一行之前, […]