Tag: pandas

python-pandas read_excel为index_col获取错误的数字

我试图阅读一个.xlsx文件,每个文件有4张,每个文件的时间和吸收率列如下所示: Time Absorbance 0 0.1254 5 0.1278 10 0.128 15 0.1286 20 0.1303 25 0.1295 30 0.1296 35 0.1308 40 0.1301 45 0.1301 50 0.1309 … 我想要使​​每个工作表的DataFrame作为不同的列和行索引当前我的代码的时间如下所示: import numpy as np import pandas as pd, datetime as dt import glob, os runDir = "/Users/AaronT/Documents/Lab/Cascade/DTRA" if os.getcwd() != runDir: os.chdir(runDir) files = glob.glob("PTE_Kinetics*.xlsx") df = pd.DataFrame() […]

在Excel中加载HDF5?

有没有办法加载/导入到Excel中的HDF5文件(有时称为H5,HD5或分层数据格式)? 我不想导出中间的CSV文件,理想情况下我想修改数据并在Excel中重新保存为HDF5(但是可接受的答案是解决加载文件的问题)。 请注意,HDF5是Python的PyTables,pandas和h5py使用的格式(这些软件包中的专家可以回答这个问题)。 不过,我宁愿不使用Python来解决这个问题(我宁愿现有的软件工具)。 也许有一种方式与ODBC …但我不知道如何。

使用> 256列的面板to_excel

我有pandas形状5 * 500 * 5000的面板。我想用Panel.to_excel把它保存到Excel文件中。 当我尝试保存到xls文件时,它会引发ValueError:列索引(256)而不是范围(256)中的整数。 据我所知,它不支持超过256列。 这个函数不支持xlsb格式。 我可以保存到xlsx或xlsm,但需要大量的时间和计算机资源。 或者我可以手动拆分面板成几个数据框,并将其保存到几个CSV文件,但我想有一个文件的数据。 我可以这样做吗?

从多个Excel文件创buildpandas数据框

嗨所以这个问题几乎和这个一样: 从多个文件创buildpandas数据框 除了我想从Excel文件的列表中读取数据。 我有一个名为“文件名”的文件名列表,我想合并成一个单一的数据框。 我的代码是: import tkinter as tk import pandas as pd import tkinter.messagebox as tr from tkinter.filedialog import askopenfilename LARGE_FONT = ("Verdana", 12) class BlahTest(tk.Tk): def __init__(self, *args, **kwargs): tk.Tk.__init__(self, *args, **kwargs) container = tk.Frame(self) container.pack(side="top", fill="both", expand=True) container.grid_rowconfigure(0, weight=1) container.grid_columnconfigure(0, weight=1) self.frames = {} frame = StartPage(container, self) self.frames[StartPage] = frame frame.grid(row=0, […]

大pandas有时写空或损坏的文件

我一直在使用pandas一段时间,我认为这是一个很好的工具。 我做了一个程序,从用户收集的一些数据生成一些Excel文件。 最终用户已经testing并使用了6个月; 它从来没有失败,直到昨天,当它产生了一个dagamaged excel文件。 当我用文本编辑器打开它时,它完全是空白的。 生成这个文件的代码是这样的: escritor = pandas.ExcelWriter(direccion, engine='xlsxwriter') listaTotal.to_excel(escritor, index = False) escritor.save() 和: escritor = pandas.ExcelWriter(direccion + '.xlsx', engine='xlsxwriter') self.listaFact.to_excel(escritor, index = False, startrow = 1, startcol = 0, sheet_name = 'Hoja1') escritor.save() 第二个代码片段也使用“xlsxwriter”的一些格式选项,这里是一个例子: format = workbook.add_format() format.set_font_size(9) format.set_font_name('Sans Serif 12cpi') format.set_border() format.set_text_wrap() 这个错误发生了两次; 大约1个月前和昨天。 我不能重复错误,我不知道发生了什么。 还有追溯在这里,它显示了程序读取文件时的问题,但是这个文件是由之前发布的代码生成的: Exception in Tkinter callback […]

使用Python来更改csv数据列格式

我正在使用pythonpandas来读取csv文件。 csv文件有一个date时间列,其中有第二精度“9/1/2015 9:25:00 AM”,但如果我在Excel中打开,它只有微小的精度“9/1/15 9:25”。 而且,当我使用pd.read_csv()函数时,它只显示最高精度。 有什么办法,我可以用python解决这个问题吗? 非常感谢。

Python Pandas自定义date时间格式在Excel输出中的字体大小

在使用to_excel()之前,Pandas中的pd.ExcelWriter的datetime_format参数非常适合格式化date时间输出。 看到这里和jmcnamara的答案,回答14年9月18日在22:23。 之后所做的所有格式设置都被忽略,这也在“使用Python Pandas和XlsxWriter”中的“Dataframe输出的格式 ”一节中介绍 。 我有两个问题: 我可以更改date时间列的font_size吗? 或者我必须通过xlswriter采取方式并写出原始数据? pd.ExcelWriter()的文档在哪里? 不应该有一个说明,告诉你可以使用哪些参数? 我只是findto_excel()的文档; 看到这里 。 谢谢!

pandas数据框来优化版本更改(索引名称在单独的行从列)

最近,我一直在使用python2.3.0,它有pandas版本0.16.2和xlsxwriter版本0.7.3。 我刚刚重新安装了一个更新的Anaconda版本,它是Anaconda2-4.0.0,它有pandas版本的0.18.0和xlsxwriter 0.8.4的pandas版本。 突然之间,许多用我以前写的本地excel图表生成excel文件的程序突然停止工作。 这是为什么: 对于一个简单的数据框,有3列名为A,B,C: 使用以前版本的pandas和xlsxwriter,df.to_excel()会生成一个像这样的excel文件, 随着新的pandas和xlsxwriter版本,这是我得到的。 差别很微妙。 但是,由于一行的差异,依靠excel文件的程序的后续步骤停止工作。 我知道我可以操纵数据框,使得excel文件中的输出看起来像前面的情况,即插入一个NaN行并将索引名称设置为“Path”。 但是,我不想这样做,因为我目前的程序相当复杂,并且有超过100个数据框被放入Excel表格的Excel文件中。 另一个原因是我也希望代码向后兼容,如果可能的话,如果我用Anaconda 2.3.0版运行代码,程序仍然可以工作。 有没有一个单行的解决scheme,使用df.to_excel(“file_name.xlsx”),使得它将生成一个excel文件与数据框的索引名称单独的行与列。

如何添加工作表到许多Excel文件,而不使用python覆盖

我需要写表格到excel文件(其中一些是现有的,但其他人没有)我使用df.groupby('mail').apply(lambda g: g.to_excel(str(g.name) + '.xlsx'), 'sheet1')我从exel文件分组数据,并希望用不同的mail分成很多很less。 我仍然有3个df ,我想分组与mail ,也添加到其他工作sheet文件。 我怎样才能在不覆盖的情况下同时发送50 mail ?

循环浏览一个文件夹,将多个Excel表格合并成一列

我有几个练习册,每个练习册有三张。 我想遍历每个工作簿,并将sheet_1所有数据合并到一个新的workbook_1文件sheet_2并将workbook_2文件& sheet_3合并到workbook_3中。 据我可以告诉下面的脚本做我需要的一切,除了附加数据之外,它覆盖了前面迭代的数据。 为简化起见,我简化了脚本,清理并简化了脚本,但如果需要的话,我很乐意分享完整的脚本。 import pandas as pd import glob search_dir= ('/Users/PATH/*.xlsx') sheet_names = ['sheet_1','sheet_2','sheet_2'] def a_joiner(sheet): for loop_x in glob.glob(search_dir): try: if sheet == 'sheet_1': id_file= pd.ExcelFile(loop_x) df_1 = id_file.parse(sheet, header= None) writer= pd.ExcelWriter('/Users/PATH/%s.xlsx' %(sheet), engine= 'xlsxwriter') df_1.to_excel(writer) writer.save() elif sheet == 'sheet_2': #do same as above else: #and do same as above […]